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Beschreibung 



Die Erfindung betrifft das oberbegrif f lich Beanspruchte und 
befaBt sich somit mit Verbesserungen bei multidimensionalen 
Feldern aus datenverarbeitenden Zellen zur Datenverarbeitung. 



Es sind bereits multidimensiqnale Felder aus datenverarbei- 
tenden Zellen bekannt. Zur Gattung dieser Bausteine zahlen 
insbesondere systolische Arrays, neuronale Netze, Mehrprozes- 
sor Systeme^ Prozessoren mit mehreren Rechenwerken und/oder 

15 logischen Zellen und/oder kommunikati-ven/peripheren Zellen 
(10), Vernetzungs- und Net zwerkbausteine wie z.B. Crossbar- 
Schalter, ebenso wie bekannte Bausteine der Gattung FPGA, 
DPGA, Chameleon, XPUTER, etc., Es sind insbesondere Bausteine 
bekannt, bei denen erste Zellen wahrend der Laufzeit ohne 

20 Storung des Betriebes weiterer Zellen umkonf igurierbar sind, 
vgl. etwa die folgenden Schutzrechte und Anmeldungen dessel- 
ben Ahmelders: P 44 16 881.0-53, DE 197 81 4l2.3, DE 197 81 
483.2, DE 196 54 846.2-53, DE 196 54 593.5-53, 
DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 . 088 . 2-53, 

25 -DE 199 80 312.9, PCT/DE QO/01869, DE 100 36 627.9-33, 
DE 100 28 397.7, DE 101 10 530.4, DE 101 11 014.6, 
PCT/EP 00/10516, EP 01 102 674.7. Diese sind hiermit zu Of- 
f enbarungszwecken vollumf anglich eingegliedert . 

30 Die dergestalt aufgebauten Bausteine weisen eine hohe Lei- 
stungsf ahigkeit auf; allerdings ist deren Einsatz aufgrund 
der hohen Kosten oftmals prohibit iv. Wo Kosten bei hohen 
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Stlickzahlen besonders relevant sind, ist es daher derzeit ub- 
lich, dedizierte Logikschaltungen in Form von ASICS und 
dergl. vorzusehen. Diese haben jedoch das Problem, besonders 
hohe Entwicklungskosten mit sich zu bringen, da sowohl der 
Entwurf der Schaltung als auch die Herstellung der Vielzahl 
von Masken teuer ist. 

Die Aufgabe der vorliegenden Erfindung besteht darin, Neues 
fur die gewerbliche Anwendung bereitzustellen. 

Die Losung dieser Aufgabe wird in unabhangiger Form bean- 
sprucht. Bevorzugte Ausf lihrungsf ormen finden sich in den 
Unteranspruchen . 



15 GemaB einem ersten Aspekt der vorliegenden ERfindung wird so- 
mit vorgeschlagen, dafi bei einer Datenverarbeitungsanordnung 
mit einem multidimensionalen Feld in Funktion und/oder Ver- 
. netzung konf igurierbarer Zellelemente und diesen zugeordneten 
Konf igurationsvorhalte-mitteln zum lokalen Konf igurat ions - 

20 Vorhalten, vorgesehen istv dafi die Konf igurat ionsvorhaltemit- 
tel dazu ausgebildet sind, zumindest einen Teil. der 
vorgehalterien Konf igurationen. nichtf luchtig vorzuhalten... 

Es wird demnach yorgeschlagen, die Leistungsf ahigkeit der 
25 multidimensionalen Prozessorf elder dadurch zu optimieren, daii 
zunachst zwar eine Vielzahl von Zellen vorgesehen wird, die 
oer. se zu einer groBen Vielzahl verschiedener Funktionen be- 
fahigt sind, aber dann aus dieser Vielzahl verschiedener 
Funktionen nur eine oder wenige Funktionen fur jede Zelle 
30 vorzusehen- Hierbei ergeben sich gegenuber dem dedizierten 

Schaltungswentwurf von Asics und dergl., bei denen exakt die 
jeweils fiir die benotigten Funktionen erf orderlichen Schalt- 
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kreise vorgesehen werden, gravierende Kostenvorteile, well 
Ruckgriff auf leicht prograimnierbare Einheiten oder durchge- 
testete Module genommen werden und so keine hohen 
Entwicklungs- und/oder Testkosten anfallen, und well uberdies 
5 • keine hohen Kosten fur eine Vielzahl von Masken entfallen, 
die beim Entwurf dedizierter Asics sonst fallig sind. Der 
Entwurf kann uber herkommliche Entwurf sprogramme fur logische 
Schaltungen erfolgen, in denen Module fur die Zellen^ Vernet- 
zungsarchitekturelemente usw. bereitgestellt werden, oder 
10 indem eine analoge, rekonf igurierbare Anordnung so konfigu- 
riert wird, bis sie die gewunschten Ergbenisse liefert und 
dann die entsprechende Funktionalitat in einer Anordnung fest 
vorgegeben wird. 



15 Besonders bevorzugt ist es, wenn die die Funktion grobgranu- 
lar konf igurierbar ist, d.h. wenn das 

Konf igurationsvorhaltemittel nur wenige Bit vorhalten mufi, urn 
eine jeweilige Funktion der Zelle zu bestimmen. Dies erleich- 
tert es, eine Vielzahl sukzessive abzuarbeitender 
20 Kpnf igurationen vorzuhalten, die aber jeweils oder zumindest 
zum Teil fest vorgegeben sind. Als Zelleleitiente konnen ziomin- 
dest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
Logiblocken vorgesehen sein. Es kann auch die Vernetzung 
grobgranular konf igurierbar seih, d.h. es werden nur wenige 
25 Bits zu setzen sein, um die Vernetzunig vorzusehen. In einer 
alternativen Weise ist.es moglich, die Vernetzung zumindest 
weitgehend fest vorzugeben und nur die jeweilige Funktion zu 
variieren. Dies ist dann bevorzugt, wenn der fertige Baustein 
etwa in seiner Funktion wie bei der Wave-Rekonf iguration je- 
30 weils eine bestimmte einer vorgegebenen Anzahl von Funktionen 
ausfuhren soil, aber die Vernetzung selbst fest steht. Dazu 
kann in bestiinm-ten Teilbereichen . nur eine Nachste-Nachbar- 
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Verbindung vorgesehen warden (auf die parallel eingereichte 
Anmeldung des Anmelders betreffend die Erhohung der Nachste- 
Nachbar-Dimensionalitat bzw. -Konnektivitat sei zu Offenba- 
rungszwecken hingewiesen . ) ^ von denen einige der Nachste- 
5 Nachbar-Verbindungen aktiviert und einige deaktiviert sind. 
In anderen Bereichen kann dagegen z.B. eine, erf orderlichen- 
falls auch lauf zeitrekonf igurierbar veranderliche 
Beschaltungsanordnung und/oder Busstruktur vorgesehen werden. 
Es sei darauf hingewiesen, daB abhangig .von den Benutzeran- 
- 10 forderungen eine Vielzahl unterschiedlicher Aufgaben mit 

einer bis auf die Konf igurationsvorgabe. unveranderten Bau- 
steinen vorgesehen werden kann, so daB sich Maskenkosten auf 
eine Vielzahl von Bausteinen verteilen und damit nicht mehr 
so stark ins Gewicht fallen. 

15 

Es ist bevorzugt, wenn jedem Zellelement ein eigenes Konfigu- 
rationsvorhaltemittel zugeordnet ist. Diese konnen die bei 
XPP-Architekturen vorgesehenen, von einem zentralen Konfigu- 
rationsspeicher zugreifbaren Konf igurationsregister ersetzen. 

2.0 Es ist moglich, in den Konf igurationsvorhaltemittel eine 
. Vielzahl von Konf igurationen vorzuhalten; dies erlaubt etwa. 
die Rekpnf iguratio.n im Betrieb, ohne. daB' eine ebenfalls teure 
und Siliziumf lache erfordernde Konf igurationseinheit inte- 
griert sein muB. Die.Auswahl der jeweils zu aktivierenden 

25 Konf igurationen kann innerhalb des Feldes iiber Statustrigger, 
. Datenoperationen, Sequenceranordnungen etc. erfolgen. Es ist 
dabei auch bevorzugt, wenn mehrere fest vorgegebene nicht- 
fluchtige Konf igurationen im Konf igurationsvorhaltemittel 
vorgegeben sind. Alternativ sind fliichtige und nicht fliichtige 

30 Konf igurationen einsetzbar. Es wird darauf hingewiesen, daB 
eine vollstandige oder partielle Konf igurationsvorgabe vor 
der Oder jeder eigentlichen Inbetriebnahme erfolgen kann. Da- 
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zu konnen auf geeignete Weise eingegebene Daten als Konfigu- 
rationen behandelt werden, die abzulegen sind. Da solche eine 
Vorab-Ablage von Rekonf igurationsdaten nicht betreibssto- 
rungsfrei geschehen mufJ^ eroffnen sich hier weitere 
5 Moglichkeiten, die Architektur zu vereinf achen; auf das sog. 
Wormholerouting sei hingewiesen, das bei lauf zeitrekonf igu- 
rierbaren Einheiten nicht f unktioniert . Alternativ und/oder 
zusatzlich kann vorgesehen sein, dafi bei einigen Zellen im 
Betrieb mit veranderlichen Konf igurationen versehbare Konfi- 
10 gurationsvorhaltemittel vorgesehen sind, d.h. ein Teil der 

Zellen uber einen Konf igurationsmanager oder auf andere Weise 
umkonf iguriert wird. 

Die wechselnde der Vielzahl von vorgehaltenen und/oder vor- 
15 bestimmten Konf igurationen, die jeweils zu verwenden ist, 

kann insbesondere im Wege der Wave-Rekonf iguration oder des 
lokalen Sequencing bestiirant bzw. geandert werden. 

Es ist moglich, die Konf igurationsvorhaltemittel auszubilden 
20 als ROM, EPROM, EEPROM, Flash-Speicher , Fuse-, Antifuse- 

programmierbare Speichermittel und/oder in insbesondere in 
oberen. Lagen einer S.iliziumstruktur fest vorgesehene Spei- 
chermittel gewahlt sind. Besonders bevorzugt sind 
Anordriugnen, die leicht und einfach bei einer grofien Stiick- 
25 zahl die Konf iguration vorsehen. Dies ist durch geeignete 

Maskierung bei der Herstellugn auf deh oberen Metalllagen er- 
reichbar (z.B. Lage M4 und/oder M5) und/oder durch 
Fuse/Antif, use-Techniken. Letztere haben den Vorteil, dali bei 
Funktionsanderungen in einer laufenden Serie Anderungen 
30 leichter implement ierbar sind. 
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Mit der Anordnung kann ein Baustein festgelegter Funktion er- 
halten warden, indem ein multidirtiensionales Feld mit in 
Funktion und/oder Vernetzung konf igurierbaren Zellelementen 
und diesen zugeordneten Konf igurationsvorhaltemitteln zum lo- 
5 . kalen Konf igurations -Vorhalten vorgegeben wird, bestimmt 

wird, welche Konf igurationen in diesen vorzuhalten sind, und 
dann nichtf luchtige Konf igurationsvorhaltemittel so vorgese- 
hen werden, dafi sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf luchtig vorhalten. Es kann dabei von 

10 eineiti zur laufzeitrekonf igurierbaren multidimensionalen Feld 
ausgegangen werden, das ein hohere Funktionalitat besitzt und 
es kann dann das Design urn bestimmte Funktionen reduziert 
werden, bis ein Kern-Bauelelement oder -eleitientblock mit vor- 
gegebener Architektur efhalten wird, bei dem nur noch wenige 

15 freie Konf igurationen zu bestimmen sind. 

Dieser Aspekt der Erfindung wird beschrieben nur besipielhaft 
beschrieben mit Bezug auf die Zeichung, in welcher zeigt 

Fig Al eine erfindungsgemaBe Datenverarbeitungsanorn- 
20 dung 

Fig A2 Details hierzu 

Nach Fig. 1 umfafit. nun eine allgemein mit 1 bezeichnete Da- 
tenverarbeitungsanordnung 1 mit einem. multidimensionalen Feld 

25 in Funktion und/oder Vernetzung konf igurierbarer Zellelemen- 
te 2 und diesen zugeordneten Konf igurationsvorhaltemitteln 2a 
zum lokalen Konf igurations-Vorhalten, wobei die Konfigurati- 
onsvorhaltemittel 2a dazu ausgebildet sind, zumindest einen 
Teil der vorgehaltenen Konf igurationen nichtf luchtig vorzu- 

30 halten. 
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Das multidimensionale Feld 1 umfaBt im vorliegenden Beispiele 
jeweils drei Reihen und Spalten PAEs, wie sie aus den Ein- 
gangs erwahnten und weiteren Verof f entlichungen des Anmelders 
per se bekannt sind. Diese Einheiten weisen grobgranular kon- 
5 f uigurierbare ALUs 2b auf, an die liber Multiplexer 2c Daten 
von einem Bussystem 2d eingehen und die beidseits mit Vor- 
warts-/Ruckwartsregistern 2e, 2f wie per se bekannt flankiert 
sind. Weiter speisen sie Ausgangsdaten tiber einen weiteren 
Multiplexer 2g auf ein Bussysterti in der Reihe darunter auf . 
"-10 Die Funktionsweise der Multiplexer 2g,2c sowie jene der ALU 
2b und der Register 2e^2f ist per se bekannt und wird hier 
nicht detailliert erlautert. Die Konf iguration, die diese 
Einheiten haben^ d.h. die Verbindung, die der Multiplexer je- 
weils aktiviert, bzw. die jeweilige Funktion der ALU, sind- im 

15 Konf igurationsspeicher 2h abgelegt. Dabei konnen fiir Se- 
quencing Oder Wave-Rekonf igu-ration eine Vielzahl von 
untershceidlichen Konf igurationen abgelegt. sein, die auf Si- 
gnale aus den Zellen oder auf externe Signale hin aktivierbar 
sind. Dabei muJi nicht fur alle Konf igurationen ein fester, 

20 unveranderlicher Speicher vorgesehen sein, sondern es kann 

auch in bestinunten Fallen ein (gegebenenf alls vergleichsweise 
kleiner) Speicher vorgesehen werden. . Dies erlaubt deitiahch ei- 
nen Zell- bzw- SpeichermiXi 

25 Wahrend in bisherigen Architekturen der konf igurationsspei- 
cher veranderlich war, und etwa von einer zentralen 
Konf igurationseinheit angesprochen wurde, ist im vorliegenden 
Fall der Konf igurationsspeicher 2h nichtf luchtig gebildet und 
sein Inhalt bei der Herstellung des die Elemente enthaltenden 

30 ICs festgelegt- 

Dies geschieht wie folgt: 
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Zunachst wird festgelegt^ welche Anzahl an Zellen und gegebe- 
nenfalls welche Zellen fur die erwartete und mit der 
Datenverarbeitungsanordnung 1 abzuarbeitende Aufgabe erfor- 
5 derlich sind. Dann werden mit diesen die Funktion simuliert- 
Das kann uber Emulatoren geschehen Oder es kann ein Feld 
lauf zeitrekonf igurierbaren Elemente mit zentraler Konfigura- 
tionseinheit zur Funktionsentwicklung bzw. zum Funktionstest 
herangezogen werden. Sobald die Funktionsentwicklung abge- 

10 schlossen ist und die erf orderlichen Konf igurationen 

festgelegt sind, wird ein Chip entwor fen, der in seineiti gro-^ 
ben Aufbau einer Vielzahl anderer, gleichartiger Chips 
entspricht und sich lediglich hinsichtlich der nichtf liichti- 
gen Konf igurationsspeicherinhalten von jenen unterscheidet . 

15 Es wird dann festgelegt, ob die nichtf luchtigen Konfigurati- 
onsspeicherinhalte mit dedizierten Metall-Lagen festgelegt 
werden und/oder durch Brennen/Schmelzen bestimmter, zur Kon- 
figuration vorgesehener Fuses/Antif uses oder auf andere 
Weise. Die Speicherinhalte werden dann wahrend der Herstel- 

20 lung des Prozesses vorgesehn und der Chip ist fur seine 

dedizierte Aufgabe ohne eine Vielzahl teurer Masken verwend- 
bar. Dabei sind zB regionale Anpassungen mog.lich> zB, um 
unterschiedliche Modems etc. zu implement ieren. 

25. In einem weiteren Aspekt der Erfinduhg befafit sich diese mit 
der integrierten elektronischen Verarbeitung von Informatio- 
nen, die in Form analoger Signale vorliegen. Dabei ist 
besonders hervorzuheben, dali etwa die analoge Verarbeitung, 
wie ersichtlich seiri wird, auf fest vorgespeicherte Konfigu- 

30 rationen zuruckgreif en kann, daJi dafur aus unterschiedlichen 
Konf igurationen auswahlbar ist und dali etwa bestimmte Zell- 
formen gleichfalls vorteilhaft sind. Fiir die integrierte 
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elektronische Verarbeitung von Inf oinnationen, die in Form 
analoger Signale vorliegen, existieren gegenwartig mehrere 
Konzepte : 

5 - Diskrete analogs, nicht programnierbare Bausteine, wie etwa 
Transistoren und Operationsverstarker ; 

- Analoge, programmierbare, integrierte Schaltkreise, genannt 
FPAAs (Field Programmable Analog Arrays) , FPMAs (Field Pro- 

10 grammable Mixed-Signal Arrays) oder FPADs (Field Programmable 
Analog Devices). FPAAs ^ FPMAs und FPADs bestehen ahnlich wie 
die digitalen FPGAs (Field Programmable Gate Arrays) aus ein- 
zelnen, programmierbaren Zellen. Im Fall von FPAAs, FPMAs und 
FPADs ist das Kernstiick einer solchen Zelle ein analoger 

15 Operationsverstarker, dem eine bestimmte Funktion aus einem 
Satz mdglicher Funktionen zugewiesen werden kann. Mogliche 
Funktionen sind zum Beispiel Addierer, Inverter, Gleichrich- 
ter und Filter erster Ordnung, mit denen ein analoges Signal 
bearbeitet werden kann. Die Zellen stehen untereinander durch 

20 ein Bussystem in Verbindung und werden durch logische Elemen-. 
te gesteuert; 

- Anwendungsspezif ische, nicht programmierbare integrierte 
Schaltkreise, 

25 genannt ASICs (Application Specific Integrated. Circuits) ; 



- Programmierbare, voll digitale Prozessoren, genannt DSPs 
(Digital Signal Processors ) oder CPUs (Central Processing 
Units), die der digitalen. Verarbeitung analoger Signale nach 
30 deren vorhergehender Analog-Digital-Wandlung dienen. Wenn 
nach der Verarbeitung wieder ein analoges Signal vorliegen 
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soli, muss nach der Verarbeitung eine Digital-Analog-Wandlung 
des Signals vorgenommen werden. 



10 



Probleme 

Diskrete analoge Bausteine 

Eine Schaltung mit diskreten Bauelementen kann aufgrund ihrer 
primaren Flexibilitat zwar optimal fiir eine bestimmte Aufgabe 
ausgelegt werden. 



Die Aufgaben der Schaltung mussen allerdings zum Zeitpunkt 
des Schaltungsentwurf s genau bekannt sein, . denn eine nach- 
tragliche Anpassung der Schaltung ah veranderte Anf orderungen 
ist nicht oder nur mit erheblichem Aufwand moglich. Dies gilt 
15 insbesondere fiir die Programmierbarkeit und fiir Umkonfigura- 
tionen im Betrieb. Aufierdem wird eine seiche Schaltung bei 
komplexeren Aufgaben schnell umfangreich. 

FPAAs, FPMAs, FPADs 

20 Die durch FPAAs, FPMAs und FPADs gegebenen Moglichkeiten zur 
Verarbeitung analoger Signale orientieren sich am Vorbild 
klassischer analoger Signalverarbe.itungsanlagen. 
Sie sind fur das zu verarbeitende Signal weitgehend transpa- 
rent, das heifit, das zu verarbeitende Signal wird bis zu 

25 einer bestimmten, bausteinabhangigen Frequenz in Echtzeit be- 
arbeitet. 

Eine einfache Moglichkeit, analoge Werte zu speichern, exi- 
stiert nicht, insbesondere nicht die Moglichkeit , den 
analogen Eingangswert und/oder den Ausgangswert jeder einzel- 
30 nen Zelle zu speichern, Viele wichtige Operationen, wie etwa 
Schleif enberechnungen, und samtliche Prozesse, bei denen meh- 
rere Signale zeitlich koordiniert nacheinander verarbeitet 
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warden, werden durch Speicherung jedoch erst moglich. Eine 
einzelne FPAA-, FPMA- oder FPAD-Zelle kann zwar als Speicher 
nach Art einer Sample-and-Hold-Stuf e konfiguriert werden. Sie 
kann dann jedoch keine zusatzliche Funktion mehr ausuben. 

5 

FPAAs, FPMAs und FPADs sind aufgrund ihrer ausschliefilich 
analogen Signalverarbeitung f unktionellen Einschrankungen un- 
terworfen. Die Fahigkeiten der in FPAAs, FPiyiAs und FPADs 
impilementierten digitalen Logik beschranken sich auf die 

10 Funktionen, die fur die Umkonf iguration der Zellen notwendig 
sind. Die Funktion der Zellen, die diese wahrend des Betriebs 
ausuben, wird durch die Logik im Stand der Technik nicht un- 
terstutzt, geschweige denn erweitert, etwa durch digitale 
Zahlfunktionen oder logische Grundf unktionen wie beispiels- 

15 weise.NAND und NOR. Insbesondere gibt es keine jeweils zu 
einer einzigen Zelle gehorenden logischen Strukturen, die 
solche digitalen Zahlfunktionen oder logischen Grundf unktio- 
nen durchfuhren konnen. Dal3 hier erf indungsgemali Abhilfe 
geschaffen wird, sei im Vorgriff erwahnt.. Mit FPAAs, FPMAs 

20 und FPADs sind deshalb logische Funktionen wie zuiti Beispiel . 
eingangssignalabhangige Entscheidungen, wenn iiberhaupt, nur 
in geringem MaJie oder nur sehr aufwendig moglich. 

basselbe gilt fur die datenabhangige Rekonf iguration von 
25 FPAAs, FPMAs und FPADs, beispielsweise (aber nicht nur) nach 
Art einer IF-THEN-ELSE-Anweisung. Diese wird erf indungsgemaU 
ermoglicht. Soli eine FPAA-, FPMA- oder FPAD-Zelle auf grund 
von Kriterien, die die zu verarbeitenden oder bereits verar- 
beiteten Analogsignale: betref fen> rekonf iguriert werden, so 
30 muli das betrof fene Analogsignal iiber eine temporare oder so- 
gar permanente Verbindung nach auiien zu einer externen, nicht 
in dem FPAA, FPMA oder FPAD enthaltenen Struktur gef uhrt. 
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werden, welche uber eine etwaige Rekonf iguration entscheiden 
und diese Rekonf iguration auslosen und durchfuhren muB. Es 
besteht fur die Zelle keine Moglichkeit, abhangig von einem 
Analog- oder Digitalsignal selbstandig, das heifit mit ihr ei- 
5 genen Strukturen^ uber eine Rekonf iguration ihrer selbst zu 
entscheiden^ diese Rekonf iguration zu veranlassen und die da- 
zu notwendigen Daten von einer internen, auf dem Baustein 
enthaltenen, dafur geeigneten Struktur zu erhalten. 

10 Will man das Ergebnis der Operation einer Zelle auf deren 
Eingang fiihren, zum Beispiel bei Schleif enoperationen, so 
kann das bei FPAAs, FPMAs und FPADs nur mittels des Busses 
geschehen; eine eigene Leitung zur Riackfiihrung des Operati- 
onsergebnisses auf den Eingang der Zelle zur Entlastung des 

15 Busses ist bei FPAAs, FPMAs und FPADs nicht vorgesehen. 

Die genannten Nachteile schlielien es aus, mit FPAAs, FPMAs 
und/oder FPADs ein analoges Rechenwerk aufzubauen, das die 
Flexibilitat und den Funktionsumf ang heutiger digitaler Re~ 
20 chenwerke erreicht. 

ASICs 

ASICs besitzen eine hohe primare Flexibilitat, da sie fiir ei- 
ne spezielie Anwendung entwickelt werden. Sie eignen sich 

25 jedoch nur fiir die jenige Anwendung, fur die sie entwickelt 

werden; rekonf igurierbar sind ASICs nur in demjenigen Rahmen, 
den die Anwendung vorgibt. andert sich die Anwendung um ein 
Detail, welches bei der Entwicklung des ASICs nicht beriick- 
sichtigt wurde, so mufi im Extremfall ein neuer ASIC 

30 entwickelt werden. 



. DSPs und CPUs. 
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Unter alien Moglichkeiten zur Signalverarbeitung konnen DSPs 
und CPUs zwar am flexibelsten konfiguriert und rekonf iguriert 
werden, allerdings weder teilweise, noch wahrend der Lauf- 
zeit . 

5 

Um Analogsignale in ein fur DSPs oder CPUs geeignetes Format 
umzuwandeln, muss.en die analogen Signale digital kodiert wer- 
. den. Dies erfordert eine Analog-Digital-Wandlung, die 
bei hoheren Anf orderungen an die Prazision recht aufwendig 

10 und teuer werdeh und iiberdies noch die Bandbreite beschranken 
kann. Entsprechendes gilt fur die Riicktransf ormation der di- 
gitalen, verarbeiteten Daten in Analogsignale. Urn 
ausreichende Schnelligkeit zu erzielen,. miissen die internen 
Bussysteme in DSPs und CPUs die einzelnen Bits eines digital 

15 kodierten Analogsignals parallel iibertragen. Die erforderli- 
che Breite des Datenbussystems wachst mit der geforderten 
Prazision der digitalen Kodierung des Signals. Im Gegensatz 
dazu genugt bei einer analogen Ubertragung eine Leitung pro 
ubertragenem Analogsignal . 

20 

DSPs und CPUs besitzen iiberdies keine zellartige Struktur, 
sondern sind in der klassischen. von-Neumann-Archite.ktur auf- 
gebaut. Ihre Modularitat ist deshalb nur gering. 

25 Die heute exististierenden analogen Rechenwerke erreichen bei 
weitem nicht den Funktionsumf ang und die Konf igurierbarkeit 
heute existierender digitaler Rechenwerke. 

Umgekehrt werden analoge Schaltungen zunehmend durch digitale 
Rechenwerke ersetzt, etwa im Fall der DSPs, wobei man die bei 
30 den DSPs genannten Nachteile in Kauf zu nehmen hat. 

Die heute existierenden Methoden zur Verarbeitung analoger 
Signale haben zxam Ziel, diese analogen Daten zu modif izieren. 
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Sind die dazu verwendeten Bausteine konf igurierbar, dann wird 
die Art und Weise, wie die analogen Signale zu modif izieren 
sind, ausschlielilich durch digitale Logik eingestellt, das 
heilit, die Steuerung erfolgt ausschlielilich durch digitale 
5 Signale. Es existieren weder Moglichkeiten, die Datenverar- 
beitungsst.euerung unmittelbar durch analoge Signale 
vorzunehmen, noch Moglichkeiten, analoge Signale mit dem 
Funktionsumf ang eines digitalen Rechenwerks zu bearbeiten. 

10 Die Erfindung umfaBt somit auch ein programmierbares, zumin- 
dest teilweise analoges Rechenwerk (Reconf igurable Analog 
Processor, RAP) mit durch logischie Elemente erweiterten Funk- 
tionen, in der Weise, daB der Funktionsumf ang eines digitalen 
Rechenwerks verbunden wird mit der Moglichkeit zur schnel- 
15 len, analogen Berechnung kbmplexer Funktionen (etwa der 

Logarithmusf unktion) und der Rekonf igurierbarkeit eines DFPs 
wie zb gemali Of f enlegungsschrif t DE4416881A1- 

Ein RAP besteht aus Zellen, die in ihrer Funktion und Vernet- 
20 zung frei konf igurierbar und wahrend der Laufzeit 

rekonf igurierbar sind- Bei der Rekonf iguration einer einzel- 
nen Zelle wahrend der Laufzeit werden andere Zellen nicht in 
ihrer Arbeit beeintrachtigt . Eine Zelle ist unterteilt in ei- 
ne Analog.sektion und eine Logiksektion. Die Analogsektion 
25 dient der Vierarbeitung analoger Dat.en auf der Basis von Ope- 
rationsverstarkerschaltungen, . wie sie von FPAAs, FPMAs und 
FPADs her bekannt sind. Die Logiksektion steuert die Funktio- 
nen der Analogsektion wahrend der Laufzeit, bei der 
Anfangskonf iguration und bei der Umkonf iguration wahrend der 
30 Laufzeit. 
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Die Analogsektion kann aber auch analog gesteuert und konfi- 
guriert werden. Die Datenverarbeitung findet wie bei FPAAs, 
FPMAs und FPADs in erster Linie analog statt; der Funktion- 
sumfang wird jedoch durch besondere Strukturen mit jeweils 
5 einer Logiksektion und verschiedenen Speichern in jeder Zelle 
dahingehend erweitert^ daii in der Zelle eingangsdatenabhangi- 
ge logische Operationen, Vergleiche^ Schleif enoperationen und 
Zahlvorgange schnell und einfach durchgefiihrt werden konnen, 
so daB ein Funktionsumf ang ahnlich dem eines voll digitalen 
10 Rechenwerks erreicht wird. 

Es besteht fiir jede RAP-Zelle zur Vereinf achung ihrer Rekon- 
figuration die Moglichkeit, abhangig von einem Analog- oder 
Digitalsignal selbstandig^ das heilJt mit ihr eigenen, inter- 
15 nen Strukturen^ uber eine Rekonf iguration ihrer selbst zu 

entscheiden^ diese Rekonf iguration zu veranlassen und die da- 
zu notwendigen Daten von einer dafur geeigneten Struktur zu 
erhalten. . 

20 Zwei unabhangige, rekonf igurierbare Bussysteme, eines fiir 
analoge Signale, das andere fur digitale Signale/ vernetzen 
die Zellen. untere.inander und mit der Aufienwelt. Jedes analoge 
Signal benotigt zu seiner. Ubertragung nur eine analoge Bus- 
leitung. Bei einem digitalen Bus wachst die Zahl der 

25 benotigten Leitungen bei paralleler Obertragung mit der ge- 
forderten Prazision der digitalen Codierung des analogen 
Signals stark an. Die notwendige Busbreite eines analogen 
Busses ist deshalb im Vergleich zu der eines digitalen Busses 
bei vergleichbarer Signalauf losuhg und Ubertragungsrate ganz 

30 wesentlich verringert. Es sei erwahnt, dass auf einem inte- 

grierten Schaltkreis Mischungen vorliegeri konnen aus analogen 
und digitalen Schaltkreisen; dabei kann eine weitgehende 
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Trennung und/oder Ubergangsbeschaltung z. B, in Form von DACs 
und/oder ACDs zwischen analogen und digitalen Elementen vor- 
gesehen werden. Die digitalen Elemente konnen ihrerseits 
durch PAEs, RAM-PAEs usw. insbesondere mit geeignetem Aspekt- 
5 verhalten gebildet sein. 

Die Erfindung beschreibt in diesem Teilaspekt sonst u.a. ein 
analoges, iimkonf igurierbares Rechenwerk (Reconf igurable Ana- 
log Processor, RAP) aus einzelnen funktionalen Zellen, die 
10 durch ein geeignetes Bussystem . untereinander und mit der Au- 
Benwelt verburiden sind. Die Funktion der Zellen ist 
konf igurierbar und kann wahrend des Betriebs so rekonfigu- 
rierbar sein, dafi dabei die Funktion anderer , nicht zu. 
rekonf igurierender Zellen nicht beeintrachtigt wird. Eine 
15 funktionale Zelle enthalt eine Analogsektion iind eine Logik- 
sektion. Die Analogsektion dient der Verarbeitung analoger 
Daten auf der Basis von Operationsverstarkerschaltungen. Die 
Logiksektion steuert die Funktionen der Analogsektion wahrend 
der Laufzeit, bei der Anf angskonf iguration und bei der Umkon- 
20 figuration wahrend der Laufzeit. Aulierdem erweitert die 

Logiksektion die rein analogen Funktionen der Analogsektion 
durch die Bereitstellung von zb Logikfunktionen. und/oder di- 
gitalen Zahlf unktionen und/oder arithmetishcen und/oder 
Speicherelementen. Jeder Zelle konnen ein oder mehrere analo- 
25 ge Speicher zugeordnet sein, die analoge GroBen wie 

beispielsweise Eingangs- oder Ausgangissignale speichern und 
zur weiteren Verarbeitung bereitstellen konnen. AuBerdem ge- 
horen zu jeder Zelle ein oder mehrere digitale Register zur 
Speicherung von digitalen Daten, die fur die. Konf iguration 
30 und den Betrieb der Zelle notwendig sind. 
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Fur jede Zelle besteht die Moglichkeit^ abhangig von einem 
Analog- oder Digitalsignal selbstandig^ das heilit mit ihr ei- 
genen internen Strukturen, uber eine Rekonf iguration ihrer 
selbst gegebenenf alls zu Gruppen zusammengef afiter Zellen oder 
5 anderer Zellen zu entscheiden, diese Rekonf iguration zu ver- 
anlassen und die dazu notwendigen Daten von einer dafiir 
geeigneten Struktur, welche sich auf dem Baustein befinden 
kann, zu erhalten. Es existiert weiterhin die Moglichkeit, 
das analoge Ergebnis der Operation einer Zelle ohne Zugriff 
*- 10 auf ein Bussystem auf den analogen Dateneingang der Zelle zu- 
riickzuf iihren . 

In diesem Abschnitt werden Begriffe verwendet, deren Bedeu- 
tung von der allgemein gebrauchlichen in manchen Punkten 
15 abweichen kann. Zum besseren Verstandnis folgen die Begriffs- 
def initionen, wie sie in diesem Abschnitt verwendet werden. 

Ein Signal soli hier definiert sein als eine GroBe, bei- 
spielsweise eine Spannung U_0(t), die zu einem bestimmten 

20 Zeitpunkt an einem bestimmten Punkt einer Schaltung herrscht. 
Ein solcher Piinkt kann beispielsweise ein Ausgang, ein Ein- 
gang oder eine Busleitung sein. Die Spannung U_0{t) kann 
entweder auf Masse (GND) oder auf eine zweite Spannung U_l{t) 
bezogen sein. Das Signal, kann zeitlich konstant oder zeitlich 

25 veranderlich sein. 



Information soli. hier definiert sein als Anzahl der mogli- 
Ghen, unterscheidbaren Zustande, die ein Signal annehmen 
kann. 

Als dlgl-bales Signal oder Digitalsignal soil hier ein Signal 
dann bezeichnet werden^ wenn e.s nur zwei Zustande^ beispiels- 
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weise 0 oder 1, annehmen kann, also nur zwei Inf ormationen iiti 
Sinne der hier verwendeten Definition der Information bein- 
haltet. 



5 Als analoges Signal oder Analogsignal soli hier ein Signal 

dann bezeichnet werden, wenn es mindestens drei und hochstens 
abzahlbar unendlich viele Zustande annehmen kann, also mehr 
als zwei Inf ormationen im Sinne der hier verwendeten Defini^ 
tion der Information beinhaltet. Das bedeutet insbesondere^ 
10 daJ5 mittels analogen Signalen immer mehr Inf ormationen 

gleichzeitig uber eine Leitung ubertragen werden konnen als 
mit digitalen Signalen. 

Im folgenden wird der Aufbau einer erf indungsgemaBen funktio- 
15 nalen Zelle und der. Aufbau des zugehorigen, die Zellen 
vernetzenden Bussystems beschrieben. 

Die Zelle 

20 Eine Zelle stellt die kleinste vollstandige^ selbstandfge 

funktionale Einheit eines RAPs dar. Dabei sind zwei verschie- 
dene Typen von Zellen moglich — die einfache Zelle und die 
erweiterte Zelle.. Beide Zelltypen konnen auf einem RAP zum 
Einsatz kommen. Sie unterscheiden. sich im Funktionsumf ang. 

25 Beiden Zelltypen gemeinsam ist die Unterteilung ihrer Struk- 
tur in eine Analogsektion und eine Logiksektion. 

Einige oder alle Zellen konnen einen T.aktvervielf acher zur 
Erzeugung eines lokalen, auf die Zelle beschrankten hoheren 
30 Taktes beinhalten^ der beispielsweise die Zahlf unktionen der 
Logiksektion der Zelle unterstutzt . Denkbar ist auch, dafi ei- 
nige Oder alle Zellen S.trukturen zur Erzeugung eines 
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zellinternen oder lokal begrenzten Zelltakts beinhalten kon- 
nen, dessen Frequenz unabhangig von der Frequenz eines 
etwaigen Bustakts konfiguriert werden kann. Der Zelltakt kann 
aktivierbar und deaktivierbar sein. 



Die einfache Zelle (SCELL) 

Die Elemente der einfachen Zelle (SCELL) gliedern sich in 
10 zwei Gruppen, genannt Analogsektion und Logiksektion. Die 

Analogsektion dient der analogen Datenverarbeitung der analo- 
gen Eingangssignale einer Zelle, . kann aber auch analoge 
Signale erzeugen,. wie beispielsweise (aber nicht nur) ein 
Rechtecksignal oder ein Dreiecksignal . Die Logiksektion 
15 stellt zusatzliche nicht-analoge Funktionen zur Verfugung, 

insbesondere zB eingangsdatenabhangige logische Operationen, 
Vergleiche und Zahlvorgange, Speicher und/oder arithmetische 
Operationen und steuert dartiberhinaus die Tatigkeit der ge- 
samten SCELL. Ein Element der Logiksektion ist die 
20 Steuerlogik (CL) . Sie steuert die Funktionen der Analogsekti- 
on und verwaltet Signale zur Rekonf iguration der Zelle, die 
uber die Bussysteme erhalten oder abgeschickt werden.. 

Die Analog-Eingangsstuf e der SCELL ist ein Multiplexer (MUXO) 
25 nach Stand der Technik fur Analogsignale . Das zu verarbeiten- 

de analoge Signal wird von einem analogen Datenbussystem 

(ABUS) auf die Eingange von MUXO gefuhrt. MUXO, gesteuert von 

der CL, selektiert das von der SCELL zu verarbeitende Ana- 

logsignal und schaltet es zu der analogen 
30 Verarbeitungseinheit (APU, Analog Processing Unit) durch. Die 

APU ist eine konf igurierbare Einheit nach Stand der Technik. 

Sie enthalt eine oder .mehrere Operationsverstarkerschal- 
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tung/en^ deren Funktion aus eineiti Satz moglicher Funktionen 
ausgewahlt werden kann. Die Auswahl der Funktion geschieht 
luittels eines digitalen Signals von der CL. 

5 Funktionen der APU konnen beispielsweise (aber nicht nur) 
sein: 

- Addition einer programmierbaren GroBe zum analogen Ein- 
garigssignal der APU 

10 - Subtraktion einer programmierbaren Grofie vom analogen Ein- 
gangssignal der APU 

- Multiplikation des analogen Eingangssignals der APU mit 
einer programmierbaren GroBe 

- Division des analogen Eingangssignals der APU durch eine 
15 programmierbare GroBe, Division einer programmierbaren Gr.oBe 

durch das analoge Eingangssignal der APU 

- Logarithmierung des analogen Eingangssignals der APU 

^ Antilogarithmierung des analogen Eingangssignals der APU 

- Invertierung des . analogen Eingangssignals der APU 

20 - Keine Veranderung des analogen Eingangssignals der APU 

- Filterf unktionen, beispielsweise Hochpasse, Tiefpasse, 
Bandpasse und Notchfilter 

- Signaler zeugung^ beispielsweise Rechtecksignale^ Dreiecksi 
gnale und Sinussignale mit programmierbaren Zeitkonstanten 

25 - Potenzierung 
-^Speicherung 

Das zu verarbeitende analoge Signal wird entsprechend der 
durch die. CL programmierten Funktion in der APU verandert 
Oder (in der Funktion eines Spannungsf olgers) nicht veran- 
30. dert, oder die APU dient der Erzeugung eines neuen analogen 
Signals. Denkbar ist insbesondere die Erzeugung eines Si- 
gnals, das eine Rekonf igurationsauf f orderung darstellt^ und 
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in dem die notwendigen Rekonf igurationsparameter in analoger 
Form kodiert sind. Der analogs Ausgang der APU ist an eine 
Speicherstuf e (BIPS) angeschlossen . Die BIPS kann sich in 
einem von mehreren durch die CL programmierbaren Zustanden 
5 befinden, beispielsweise in einem der folgenden. 

BUFNONINV: Das Ausgangssignal der BIPS. hat denjenigen Wert, 
der an ihrem Eingang lag, als die BIPS ein BUFFER-Signal von 
der CL erhielt. Der Ausgangswert wird konstant gehalten, so- 
10 lange das BUFFER-Signal anliegt. 

BUFINV: Das Ausgangssignal der BIPS hat denjenigen invertier- 
ten Wert, der an ihrem Eingang lag, als die BIPS ein BUFFER- 
Signal von der CL erhielt. Der Ausgangswert wird konstant ge- 
15 halten, solange das BUFFER-Signal anliegt, 

INVERT: Das Eingangssignal der BIPS wird inyertiert, 

PASS: Die BIPS schleift das Eingangssignal unverandert durch. 

20 

3STATE: Der Ausgang der BIPS nimmt eineh hochohmigen Zustand 
ein. 

m . ... 

Der Ausgang der BIPS ist mit dem Eingang eines analogen De- 
25 multiplexers (DeMUX) verbunden, dessen Ausgange mit den 

Busleitungen des ABUS verbunden sind. Uber die CL wird ge- 
steuert, auf welchen Ausgang des DeMUX das verarbeitete 
analoge . Signal gefuhrt wird. 

30 Als zusatzliches Element der Logiksektion einer SCELL zur Er- 
weiterung des Funktionsumf anges der SCELL existiert die 
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LOGUNIT. Sie ist in der Lage, beispielsweise folgende Funk- 
t ionen durchzuf uhren : 



- digitale Zahler^. die von der CL und/oder der APU gesetzt, 

5 getriggert^ abgefragt ruckgesetzt und angehalten warden kon- 
nen.; diese konnen als grobgranulare Logikelemente gebildet 
sain; andere grobgranulare Logik- und/oder Funktionselemente 
wie arithmetische, insbesondere ALUartige und/oder speichern- 
de Elemente sind gleichfalls iitiplementierbar . 

"10 

- logische Grundf unktionen, wie NAND, NOR, AND, OR, XOR, 
INVERT, BUFFER, die. aus der CL und/oder APU stammende Infor- 
mationen logisch miteinander verknupfen konnen. Hier handelt 
es sich also uiti f eingranulare Logikelemente. Solche In'forina- 

15 tionen konnen abhangig vom Status der CL und/oder der APU 

sein, und/oder von zu verarbeitenden Signalen. Insbesondere 
konnen solche Inf ormationen Kriterien sein, die auch zur Bil- 
dung eines RECONREQ-Signals (Rekonf iguration-Request ) f uhren. 



20 

Die erweiterte Zelle (ECELL) 

Die erweiterte Zelle (ECELL) enthalt in einer bevorzugten 
Ausfuhrungsf orm eine vollstandige, voll funktionale SCELL, 
25 die urn zusatzliche Elemente und Funktionen erweitert wurde, 
urn insbesondere (aber nicht nur) Schleiifenoperat ionen ohne 
Zugriff auf das Bussystem durchf uhren zu konnen. 



Die analoge Eingangsstuf e (MUXO ) ist um einen zweiten, 
30 gleichwertigen, auf den ABUS zugreifenden analogen Multiple- 
xer (MUXl) erweitert. Mit MUXO und MUXl ist es moglich, statt 
(wie bei einer SCELL) nur. einem Eingangssignal zwei Eingangs- 
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signale zur anschlieBenden Verarbeitung in der Zelle freizu- 
geben. Aulier den Busanschlussen besitzen MUXO und MUXl 
jeweils zusatzlich noch einen Eingang, der auf Masse gelegt 
ist und einen Eingang, auf den das Ergebnissignal vom Aus- 
5 -gang der BIPS der ECELL zuriickgef tihrt wird. Der Ausgang von 
MUXO fuhrt das von MUXO zur Verarbeitung selektierte Ana- 
logsignal, welches ausdrucklich auch der konstante 
Massepegel oder das Ergebnissignal voih Ausgang der BIPS der 
ECELL sei kann. Der Ausgang von MUXl fuhrt das von MUXl zur 
*• 10 Verarbeitung selektierte Analogsignal, welches ebenfalls auch 
der konstante Massepegel oder das Ergebnissignal vom Ausgang 
der BIPS der ECELL sei kann. 

Die Ausgangssignale von MUXO und MUXl werden auf die folgen- 
15 den, progranunierbaren Speicherstuf en (BUFFO, BUFFI) gefiihrt.. 
BUFFO erhalt das Ausgangssignal von MUXO, BUFFI erhalt das 
Ausgangssignal von MUXl. BUFFO und BUFFI sind durch die CL 
konf igurierbare Einheiten, deren Funktion aus einem Satz 
moglicher Funktionen ausgewahlt werden kann. Mogliche Funk- 
20 tionen von BUFFO und BUFFI sind beispielsweise 

BUFNONINV: Der Wert des Au^gangssignals von BUFFO bzw. BUFFI 
ist gleich demjenigen analogen Eingangssignal, das anlag,. als 
BUFFO bzw. BUFFI ein BUFFER-Signal von der CL. erhielt. Der 
25 Ausgangswert wird konstant gehalten, solange das BUFFER- 
Signal anliegt. 

BUFINV: Der Wert des Ausgangssignals von BUFFO bzw. BUFFI ist 
gleich demjenigen analogen Eingangssignal, das anlag, als 
3.0 BUFFO bzw. BUFFI ein BUFFER-Signal von der CL 

erhielt. Der Ausgangswert wird konstant gehalten, solange das 
BUFFER-Signal anliegt. 
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INVERT: Das aktuelle analoge Eingangssignal von BUFFO bzw. 
BUFFI wird invertiert. 

5 PASS:. BUFFO bzw. BUFFI schleift das aktuelle Eingangssignal 
unverandert durch. 

Das Ausgangssignal von BUFFO und das Ausgangssignal von BUFFI 
werden auf jeweils einen analogen Eingang der erweiterten 
*- 10 analogen Verarbeitungseinheit XAPU der ECELL gefuhrt-. Alle 
Funktionen der APU einer SCELL sind in der XAPU einer ECELL 
enthalten. 

Im. Gegensatz. zur APU der SCELL besitzt die XAPU zwei analoge 
Eingange, so dali in der XAPU Operationen mit zwei analogen, 

15 zeitlich konstanten oder zeitlich veranderlichen Signalen 

moglich sind, insbesondere die Addition, Subtraktion, Multi- 
plikation und Division zweier solcher Signale. Es ist damit 
denkbar, die XAPU mittels eines analogen, zeitlich konstanten 
Oder zeitlich veranderlichen Steuersignals zu prograininieren, 

20 indem bestiiranten Werten des Steuersignals bestimmte Funktio- 
. nen zugewiesen werden. Dariiberhinaus ist es denkbar, mit 
einem analogen Steuersignal der APU einen zur Aus.uburig einer 
Funktion notwendigen Parameter zu libermitteln. Wenn bei- 
spielsweise f(t) ein analoges zeitlich veiranderliches 

25 (Spannungs-). Signal ist, welches mit einem zeitlich verander- 
lichen (Spannungs-) Signal g(t) multipliziert werden soil, 
kann die XAPU dann als Multiplikator nach Art eines span- 
nungsgesteuerten Verstarkers (Voltage Controlled Amplifier, 
VCA) nach Stand der Technik programmiert werden, wobei f (t) 

30 an einem analogen Eingang der XAPU liegt, wahrend g(t) am an- 
deren analogen Eingang der XAPU liegt und das besagte 
Steuersignal darstellt. 
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Das Ausgangssignal der XAPU wird auf den Eingang der BIPS ge- 
fuhrt. Die BIPS der ECELL und die BIPS -der SCELL konnen 
gleich sein. Das Ausgangssignal der BIPS wird auf den Eingang 
5 des DeMUX gefuhrt. Der DeMUX der ECELL und der DeMUX der 
SCELL konnen gleich sein. Aulierdem wird das Ausgangssignal 
der BIPS iiber eine. separate Leitung auf einen Eingang von 
MUXO sowie auf einen Eingang von MUXl gefuhrt. 

■ 10 Die Logiksektion kann ein Element zur Taktvervielf achung ent- 
halten, welches den Takt des DBUS vervielf acht ^ und das 
programmierbar sein kann. Damit kann die ECELL intern mit ei- 
neiti Vielfachen des DBUS-Taktes operieren. 

15 Rekonf iguration einer Zelle (cellreconf ig) 

Das RECONREQ-Signal 

Die Analogsektion und die Logiksektion der Zelle sind bevor- 
zugt in der Weise strukturiert und verbunden, dali die Zelle 

20 bei Eintreten bestimmter Kriterien ein Signal^ das RECONREQ- 
Signal^ erzeugen kann, mit welchem sie ihre eigene Rekonfigu- 
ration oder die Rekonf iguration einer anderen Oder mehrerer 
anderer Zellen veranlassen kann. Das RECONREQ-Signal kann di- 
gital sein und uber ein separates digitales Bussystem 

25 weitergeleitet werden. Es kann aber auch analog sein und uber 
ein separates analoges Bussystem weitergeleitet werden. 
. Mit einem analogeri RECONREQ-Signal ist es moglich^ neben den 
.RECONREQ-Inf ormationen noch zusatzliche Inf ormationen, zum 
Beispiel die Adresse der zu rekonf igurierenden Zelle oder der 

30 zu rekonf igurierenden Zellen, gleichzeitig auf nur einer 
Busleitung zu ubertragen. 
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Kriterien^ die ein RECONREQ-Signal auslosen^ konnen zum Bei- 
spiel (aber nicht nur) sein: 

- Ein bestiiximter Signalpegel, der von in der Zelle auftreten- 
5 den Analogsignalen (zu denen auch die analogen Eingangs- und 

Ausgangssignale zahlen) erreicht, uberschritten oder unter- 
schritten wird. 

- Eine bestimmte Signaldif f erenz, die zwischen in der Zelle 
10 auftretenden Analogsignalen (zu denen auch die analogen Ein- 
gangs- und Ausgangssignale . zahlen). / erreicht^ uberschritten 
Oder unterschritten wird. 

- Eine bestimmte zeitliche Anderung eines Signalpegels^ die 
15 von in der Zelle auftretenden Analogsignalen (zu denen auch 

die analogen Eingangs- und Ausgangssignale zahlen) erreicht, 
uberschritten oder unterschritten wird. 

- Das Verstreichen . einer bestimmten Zeitspanne. 

20 ■ 

- Das Auftreten eines bestimmten digitalen Signals oder einer 
bestimititen Kombination digitaler Signale in der Zelle , oder an 
den digitalen Eingangen und/oder Ausgangen der Zelle. 

25 Die in der obigen Auflistung genannten Signale konnen aus- 

driicklich auch von anderen Zellen oder weiteren Elementen des 
RAPs stammen. AuBerdem konnen durch logische Verknupfung 
(AND, OR, NAND, NOR, XOR usw. ) der genannten Kriterien weite- 
re Kriterien gebildet warden. Die Logiksektion der ECELL 

30 enthalt zur logischen Verknupfung von Kriterien geeignete 
Strukturen, zB fur Ergebnisvergleich, Flags einer ALU wie 
Ubertrag einer arithmetischen Einheit (carry etc) 
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10 



15 



Die Kriterien zur Bildung eines RECONREQ-Signals werden in 
der CL der Zelle ausgewertet. Die CL der Zelle generiert aus 
diesen Kriterien ein digitales Wort (RECONREQ-Wort ) mit den 
notigen RECONREQ-Inf ormationen . 

Dieses RECONREQ-Wort kann in digitaler oder analoger Form von 
der Zelle weitergegeben werden. Dafur stehen eigene Bussyste- 
me (RECONREQ-Bus) , ein digitaler Bus und ein analoger Bus, 
zur Verfugung. 

Soil das RECONREQ-Wort in analoger Form weitergegeben werden, 
so wird das digitale RECONREQ-Wort in einem Digital-Analog- 
Umsetzer (DAC) in analoge Form gebracht. Jede Zelle kann zu 
diesem Zweck einen solchen DAC besitzen. 



Die Daten, die zur Rekonf igurierung der Zelle notwendig sind, 
stellen eine dafur geeignete Struktur zur Verfugung. Diese 
Struktur kann beispielsweise eine Ladelogik und eine Swit- 
ching-Tabelle sein, wie sle in Patentanmeldung DE196 54 
20 84 6.2 beschrieben sind. 

Die Ladelogik 

Die Ladelogik (LL) ist eine Struktur, die nach einem 
25 RECONREQ-Signal die Rekonf iguration der betreffenden Zelle 

Oder der betreffenden Zellen durchfiihrt. Mehrere Zellen ste- 
hen mit jeweils einer einzigen LL iiber den RECONREQ-Bus in 
Verbindung. Diese Zellen bilden mit der zugehorigen LL einen 
Cluster. Jede Zelle eines Clusters kann ein RECONREQ-Signal 
30 an ihre LL absetzen und so jede Zelle desselben Clusters zur 
Rekonf iguration auffordern. Andere Moglichkeiten, eine Rekon- 
f iguration anderer Zellen auszulosen, bestehen gleichfalls. 
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Verwiesen wird auf die o.g. Schriften und weitere Schriften 
der vorliegenden Anmelderin. Ein Baustein kann mehrere Clu- 
ster enthalten. Die LLs dieser Cluster stehen untereinander 
uber ein Bussystem in Verbindung und konnen somit Informatio- 
5 nen austauschen. Solche Inf ormationen konnen insbesondere 

Adressen von umzukonf igurierenden Zellen sein. Dadurch ist es 
jeder beliebigen Zelle des RAPs moglich, jede beliebige Zelle 
des RAPs zur Rekonf iguration aufzufordern. 

10 Die LL kann entsprechend PACT_SWT (vergl. zitierte Patentan- 
meldung) aufgebaut sein und kann damit digit ale RECONREQ- 
Worte direkt verarbeiten. Die LL benotigt fur die Verarbei- 
tung eines analogen RECONREQ-Wortes jedoch analoge 
Vorstufen, namlich eine analoge Selektierstuf e (ASELSTAGE) 

15 und eine. Analog-Digital-Wandlerstuf e (ADC) . Die Aufgabe der 
ASELSTAGE ist es, zu priifen, ob und an welchem analogen 
RECONREQ-Bus ein RECONREQ-Signal anliegt. Ist ein RECONREQ- 
Signal auf einem analogen RECONREQ-Bus vorhanden, so wird 
dieser Bus von der ASELSTAGE selektiert und zur weiteren 

20 Verarbeitung auf den ADC geschaltet, welcher das analoge 

RECONREQ-Wort in ein digitales RECONREQ-Wort zuruckwandelt , 
das von der LL verarbeitet werden kann. 

Die ASELSTAGE kann auf verschiedene Arten realisiert werden. 
25\ Eine Moglichkeit ist die Verwendung eines Multiplexers^ eine 
andere die Verwendung eines Arbiters. 

ASELSTAGE als Multiplexer. Die analogen RECONREQ-Busse der 
von der LL uberwachteri Zellen liegen an den Eingangen eines 
30 getakteten Analogmultiplexers nach Stand der Technik. Bei je- 
dem Takt wird der Multiplexer um einen Eingang 
weitergeschaltet^ so dafi bei jedem Takt ein anderer Bus am 
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Ausgang des Multiplexers liegt. Ein Komparator uberwacht den 
Ausgang des Multiplexers. Wenn kein analoges RECONREQ-Signal 
am Ausgang des Multiplexers liegt, hat der Ausgang des Multi- 
plexers einen bestimmten Pegel, beispielsweise 0 Volt. Liegt 
5 ein RECONREQ-Signal an, liegt ein anderer Pegel am Ausgang 
des Multiplexers, was den Komparator dazu veranlaBt, das 
RECONREQ-Signal auf den nachf olgenden ADC zu schalten. Al- 
ternativ und/oder zusatzlich konnen mehrere Komparatoren 
vorgesehen sein, die das Signal mit unterschiedlichen Si- 
10 . gnalpegeln vergleichen und so unmittelbar eine Auswertung 

bewirken. Dies, bietet sich ins.besondere an, wenn nur wenige 
Signalstufen zu unterscheiden sind. 

ASEIiSTAGE als Arbllzer. Die analogen RECONREQ-Busse der Zellen 
15 eines Clusters werden zunachst auf die Eingange eines analo- 
gen Multiplexers (AMUX) gefuhrt. Liegt an einem der analogen 
RECONREQ-Busse ein RECONREQ-Signal an, so wird dieser Bus 
durch den AMUX selektier und das anliegende RECONREQ-Wort auf 
den Ausgang des AMUX ge.schaltet. 

20 

Bussysteme 

Ein RAP enthalt bevorzugt zumindest zwei voneinander unabhan- 
gige, flexible Bussysteme zur Vernetzung der einzelnen Zellen 
und. zur Verbindung des RAPs miit der Aulienwelt. Die . bevorzug- 

25 ten Bussysteme konnen konfiguriert und wahrend der Laufzeit 
rekonfiguriert werden, ohne daB die TStigkeit des RAP unter- 
brochen werden muB . Die Bussysteme konnen mit Eigenschaf ten 
ausgestattet sein, wie sie in Patentanmeldung DE 197 04 742.4 
beschrieben sind. Unterschieden wird hier das analoge Bussy- 

30 stem und das digitale Bussystem. 

Das analoge Bussys/bem (ABUS) 
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Das analoge Bussystem ABUS dient der Obermittlung der zu be- 
arbeitenden, bereits bearbeiteten oder neu erzeugten analogen 
Daten und analogen Signale von aulien an die Zellen und/oder 
zwischen den Zellen. Insbesondere ist es mit dem ABUS mog- 
5 lich, Zellen zu .kaskadieren, um auf diese Weise ein analoges 
Signal in mehreren auf einanderf olgenden Operationen zu bear- 
beiten, wobei eine Operation von jeweils einer Zelle 
durchgefuhrt wird. 

Der ABUS kann mit jeder seiner Leitungen mehrere/ insbesonde- 
10 re mehr als zwei Inf ormationen gleichzeitig iibertragen, zum 
Beispiel -256 Inf ormationen. Der ABUS kann mit einer festen 
Oder variablen Frequenz getaktet sein oder asynchron, das 
heifit nicht getaktet,. sein. Die Implementierung des ABUS kann 
in einer Art und Weise erfolgen, wie sie in Patentanmeldung 
15 DE 197 04 742.4 beschrieben ist. 

Das d±g±t:ale Bussys-bem (DBUS) 

■ Neben dem ABUS existiert auf dem RAP ein zweites Bussystem, 
genannt DBUS. 

20 Der DBUS ist . getaktet und dient der Distribution digitaler 
Daten, beispielsweise Konf igurationsdaten und Statusdaten, 
zwischen den Zellen. Die Logiksektion jeder Zelle ist an den 
DBUS angeschlossen. Die Implementierung des DBUS kann in ei- 
ner. Art und Weise erfolgen, wie sie in Patentanmeldung 

25 DE 197 04 742.4 beschrieben ist. 

Dieser Aspekt der Erfindung wirdmit Bezug auf die Zeichnung 
nachfolgend besipielhaft erlautert, wobei dargestellt ist 
durch 

30 Figur Bl zeigt den. Aufbau einer einfachen Zelle 

Figur B2 zeigt den Aufbau einer erweiterten Zelle 
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Figur B3 zeigt eine mogliche Art der Realisierung von BUFFO 
bzw. BUFFI 

Figur B4 zeigt, wie beispielsweise der Ausdruck f(t)^g(t) be- 
rechnet werden kann. 



Fxgur 1 zeigt den Aufbau einer einfachen Zelle (SCELL).Sie 
besteht aus der Digitalsektion (0101) und der Analogsektion 
(0102).. Zentrales Element der Logiksektion ist die Steuerlo- 
10 gik CL (0110)^ die uber den DBUS (0130) mit anderen Zellen, 
zusatzlichen Strukturen wie beispielsweise. einer Ladelogik 
und/oder einer Switching-Tabelle, wie sie in Patentanmeldung 
DE 196 54 846-2 beschrieben sind, und/oder der Aufienwelt kom- 
munizieren kann. 

15 

Der Multiplexer MUXO (0121) ist an den ABUS (0131) ange- 
schlossen. Sofern ein Analogsignal von der SCELL zu 
verarbeiten ist, selektiert MUXO (0121), iiber die Leitungen 
(0141) von der Steuerlogik CL (0101) oder einer anderen ge- 

20 eigneten Struktur gesteuert, diejenige Leitung des ABUS 

(0131), auf der das zu verarbeitende Analogsignal anliegt. 
Der Ausgang von MUXO (0121) ist iiber die Leitung 0146 mit 
der analogen Verarbeitungseinheit APU (0120) verbunden. In 
ihr wird das .von.MtJXO selektierte Signal verarbeitet, sofern 

25 ein Signal selektiert wurde, oder die APU generiert ein Si- 
gnal, welches ein RECONREQ-Signal sein karin, oder die APU 
verharrt in einem vordef inierten Ruhezustand. Das Verhalten 
der APU wird von der CL (0101) iiber die Leitungen 0143 ge- 
steuert. Diese Leitungen (0143) konnen bidirektional 

30 ausgefiihrt sein, so daB die APU in der Lage ist, abhangig von 
bestimmten Ereignissen und Kriterien Signale an die CL (0101) 
zu schicken. Die Kriterien konnen solche sein, die bei- 
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spielsweise auch zur Erzeugung eines RECONREQ-Signals fiihren. 
Ein erzeugtes Signal kann insbesondere ein RECONREQ-Signal, 
wie in Abschnitt cellreconfig beschrieben, sein. Das von der 
APU verarbeitete oder erzeugte Signal gelangt uber die Lei- • 
5 tung 0149 auf eine Speicherstuf e BIPS (0124), deren Funktion 
von der CL (0101) gesteuert wird.. Dabei stehen die in Ab- 
schnitt scell beschriebenen Funktionen BUFNONINV, BUFINV, 
INVERT, PASS, 3STATE zur Verfiigung. Am Ausgang der BIPS wird 
das Analogsignal von einem Demultiplexer DeMUX (0125) iiber- 
10 nommen, der es, gesteuert von der CL iiber Leitung 0145 oder 
einer anderen geeigneten Struktur, auf den ABUS 0131 schal- 



Die Logiksektion (0101) der SCELL besteht aus der CL (0110) 
15. und der LOGUNIT (0111), die uber die Leitung 0140 miteinander 
in Verbindung stehen.. 

Figur 2 zeigt den Aufbau einer erweiterten Zelle (ECELL) . 
Sie ist funktionell unterteilt in eine Analogsektion (0202) 

20 und eine Logiksektion (0201). Die analbgen Multiplexer MUXO 
10221) und MUXl (0222) selektieren:, gesteuert von der CL 
(0210) der ECELL, die beiden Analogs ignale, die von der. ECELL 
yerarbeitet Weirden. sollen. MUXO seiektiert dabei das erste 
Analogsignal, MUXl seiektiert .das zweite Analogsignal. Fiir 

25 die Herkunft der beiden zu verarbeitenden Analogsignale gibt. 
es drei Moglichkeiten. 

Entweder stammt das erste und/oder das zweite Analogsignal. 
vom ABUS, oder das erste und/oder das zweite Analogsignal 
sind identisch mit der festen Massebezugsspannung GND, oder 
3d das erste und/oder das zweite Analogjsignal sind identisch mit 
dem Ausgangssignal der BIPS (0225) , welches mittels der Lei- 
tung 0252 auf jewe.ils. einen Eingang von MUXO und MUXl 
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zuruckgefiihrt wird. Das erste Analogsignal gelangt von MUXO 
uber die Leitung 0246 auf BUFFO (0223) . Das zweite Analogsi- 
gnal gelangt von MUXl uber die Leitung 0247 auf BUFFI (0224) . 
Die beiden Analogsignale konnen in BUFFO bzw. BUFFI gemali den 
5 in Abschnitt uber die Ecell beschriebenen Betriebsarten von 
BUFFO und BUFFI verandert werden. BUFFO und BUFFI konnen uber 
die Leitung 0242 unabhangig voneinander durch die CL (0210) 
gesteuert werden. Das analoge Ausgangssignal von BUFFO (0223) 
gelangt uber die Leitung 0248 auf den ersten Analogeingang 

10 der XAPU (0220) . Das analoge Ausgangssignal von BUFFI (0224)- 
gelangt iiber die Leitung 024 9 auf den zweiten Analogeingang 
der XAPU (0220) . Die XAPU (0220) verarbeitet die beiden ana- 
logen Eingangssignale zu einem analogen Ausgangssignal gemaB 
der durch die CL (0210) uber die Leitung 02.43 programmierten 

15 Funktion, wie in Abschnitt Ecell beschrieben. Das analoge 

Ausgangssignal der XAPU (0220) wird mittels der Leitung 0250 
an eine weitere Speicherstuf e (BIPS, 0225) ubertragen. Die 
BIPS der ECELL und die BIPS der SCELL konnen gleich sein. 
Die Funktion der BIPS (0225) wird von der CL (0210) durch die 

20 Leitung 0244 gesteuert. Das analoge Ausgangssignal der BIPS 
wird durch die Leitung 0251 auf den Demultiplexer (DeMUX, 
0226) ubertragen, der das Signal auf den ABUS (0231) auf- 
schaltet. Der DeMUX wird von der CL (0210) gesteuert. 

25 Die Logiksektion (0201) der ECELL besteht aus einer vollstan- 
digen Logiksektion, wie sie in einer SCELL zu fihden ist, 
also der CL (0210) und der LOGUNIT (0211), die uber die Lei- 
tung (0240) miteinander in Verbindung stehen. Die 
Logiksektion der ECELL ist daruberhinaus in der Lage, die 

30 XAPU (0120) mit ihrem gegeniiber der APU einer SCELL erweiter- 
ten Funktionsumf ang zu steuern und zu verwalten. 
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Beispielsweise logische Operationen wie beispielsweise NAND, 
NOR, AND, OR, XOR ermoglichen. Eingangsvariablen solcher Ope- 
rationen konnen solche Kriterien sein, die auch zur Bildung 
eines RECONREQ-Signals fuhren, aber auch digitals Signale, 
5 die eigens dafiir erzeugt werden. 

Figur 3 zeigt eine mogliche Art der Realisierung von BUFFO 
bzwA BUFFI. OPO ist ein Operationsverstarker,. der so be- 
schaltet ist, dali er das am Eingang IN liegende analoge 

10 Signal wahlweise invertiert Oder durchschleif t . Die Betriebs- 
art wird durch DeMUXO ausgewahlt. Wenn am . Steuereingang 
NONINV INV eine logische 0 liegt, wird das Eingangssignal 
durchgeschleif t, wenn am Steiiereingang NONINV INV eine logi- 
sche 1 liegt, wird das Eingangssignal invertiert. Uber DeMUXl 

15 wird entschieden, ob das Signal im Kondensator C zwischenge- 
speichert wird (BUFFER) , Oder ob es ohne Zwischenspeicherung 
am Ausgang OUT von OPl zur Verfugung steht (PASS) . Zwischen- 
speicherung erfolgt, wenn der Steuereingang BUFF PASS eine 
logische 0 erhalt . 

20 Keine Zwischenspeicherung erfolgt, wenn der Steuereingang 
BUFF PASS eine logische 1 erhalt. 



Flgur 4 zeigt, wie beispielsweise der Ausdruck f(t)'^g(t) be- 

25 rechnet werden kann. 

Dazu wird in der ersten Zelle f (t) logarithmiert, das bedeu- 
tet, von f (t) wird der. Lpg.arithmus zur beliebigen, aber 
festen Basis a gebildet. Dazu kann eine SCELL dienen, die als 
Logarithmierer konf iguriert ist. Das Ergebnis dieser Operati- 

30 on wird in der zweiten Zelle mit g(t) multipliziert . Dazu 
kann eine ECELL dienen, die beide Signale nach Art eines 
spannungsgesteuerten Verstarkers miteinander multipliziert. 
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In der dritten Zelle wird die Basis a mit dem Ergebnis der 
Multiplikationsoperation potenziert. Dazu kann eine SCELL 
dienen, die als Delogarithmierer konfiguriert ist. Das Ergeb- 
nis der Delogarithmierungsoperation entspricht dem Ausdruck 
5 ([f (t)]-{g(t) }. 

Vorstehend wurde beschrieben, wie eine Einheit mit konfigu- 
rierbaren analogen Einheiten aufgebaut werden kann. Es wurde 
vorgeschlagen, analoge Signale fiir Arbeiten mit Zellen so 
*- 10 auszubilden^ dass sie im Betrieb anderer Zellen rekonfigu- 
rierbar sind und es wurde vorgeschlagen, ihnen dafur eine 
geeignete Beschaltung zuzuordnen. Es ist nun einzuschStzen, 
dass die Moglichkeit besteht^ einen Baustein zu bilden^ bei 
welchem eine Signalverarbeitung sowohl analog als auch digi- 

15 tal erfolgt. Es ist dann mogiich, die digitale 

Signalverarbeitung gleichfalls mit rekonf igurierbaren Bauele- 
menten vorzusehen, etwa durch ein multidimentionales Feld 
rekonf igurierbarer digitaler Einheiten^ wie es in den ver- 
schiedenen Patentanmeldungen des vorliegenden Anmelders 

20 beschrieben wurde. Um die erf orderliche Wandlung vorzusehen, 
konnen einzelne oder mehrere Umsetzerstuf en vorgesehen sein.^ 
d. h. ein oder mehrere Analog-Digital-Wandler und erforderli- 
chenfalls mehrere Digital-Analog-Wandler . Uberdies ist es 
moglich, verschiedene Wandlerverf ahren einzusetzen und. die 

25 Genauigkeit der Wandlung bei Vorsehen mehrerer Wandlereinhei- 
ten unterschiedlich zu gestalten. Gleichfalls ist es mo.glich, 
neben einfachen logischen Schaltungen, die einem Analogele- 
ment zugeordnet werden, auch kpmplexere Logik-und 
Funktionskreise vorgesehen werden konnen. 

30 

Es wird einzuschatzen sein, dass die Vielzahl der Analogele- 
mente, Busse usw. sowie der gegebenenf alls erf ordierlichen 
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Wandlereinheiten einem jeweiligen Zweck ohne weiteres anpass- 
bar sind, etwa um Hochf requenzanwendungen zu genugen oder, 
bei Niederf requentenanwendungen, eine extreme Rauscharmut 
bzw- ein sehr gutes Signal- Rauschverhaltnis vorzusehen. 

Es sei welter erwahnt, dafJ bevorzugt die digitalen und analo- 
gen Elemente gemischt werden, insbesondere auf ein und 
demselben IC. Dazu kann in einem gemischtne Feld vermittels 
eines oder mehrer ADCs und/oder DACs und/oder Komparatoren 
ein Ubergangsmittel vorgesehen werden. Dies ist vorteilhaft, 
wei.l etwa im Bereich Software defined Radio die rein digitale 
Abarbeitung der ankommenden hochf requent en schwachen Anten- 
nensignale noch problematisch ist, wobei trotzdem auch 
bezuglich der analogen Signalbe- und/oder -verarbeitung eine 
groBe Wahlfreiheit erwiinscht ist. 

Die Erfindung betrifft welter Vorrichtungen und Verfahren zur 
Verbesserung des Transfers von Daten innerhalb von mehrdimen- 
sionalen Anordnungen von Sendern und Empfangern bzw. -zellen. 
DaB diese gerade in kritischen Applikationen wie Software de- 
fined Radio besonders relevant ist, sei erwahnt. 

Die Zellen von etwa multidimensionalen Prozessorf eldern kon- 
nen nun unterschiedlichen Funktionen ausfuhren, etwa 
Bool^sche Verkniipf ungen von Eingangs-Operanden bewirken, 

Zwischen ihnen verlaufen Verbindungen, die gleichfalls: ein- 
stellbar sind, typisch etwa Busse, die auf verschiedene Weise 
eine Vernetzung bewirken konnen und so ein in seiner Vernet- 
zung einstellbares multidimensionales Feld aufbauen. UBer die 
Busse Oder anderen Leitungen tauschen die Zellen miteinander 
wie erforderlich Inf ormationen aust, etwa Statussignale, 
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Trigger oder die zu verarbeitenden Daten. Typisch sind dabei 
in einem zweidimensionalen Prozessorf eld etwa die Zellen Rei- 
hen- und spaltenweise angeordnet, wobei die Ausgange von 
Zellen einer ersten Reihe auf Busse gefuhrt, an die zugleich 
die Eingange der Zellen der nachsten Reihe zu koppeln sind. 
Bei einer bekannten Anordnung (Pact XPP) sind zudem Vorwarts- 
und Riickwartsregister vorgesehen, urn Daten unter Umgehung von 
Zellen auf Bussysteme anderer Reihen zu leiten, ein Balancing 
von parallel auszuf iihrenden Zweigen zu erreichen, usw. Es ist 
auch schon vorgeschlagen worden^ derartige Vor- und/oder 
Riickwartsregister mit einer iiber den reinen Datentransf er 
hinausgehenden Funktionalitat zu versehen. 

Um eine bestimmte Art der Datenverarbeitung durchzuf iihren, 
muB jeder Zelle eine bestiinmte Funktion zugewiesen werden und 
es ist eine geeignete Vernetzung vorzusehen. Es muli dazu, be- 
vor das multidimensionale Prozessorf eld Daten wie gewiinscht 
verarbeitet, festgelegt werden, welche Zelle welche Funktion 
ausfiihren soil, es ist fiir jede an einer Datenverarbeitungs- 
aufgabe beteiligen Zelle eine Funktion festzulegen und es muB 
die Vernetzung bestimmt werden. Dabei ist es wunschenswert , 
die Funktion und Vernetzung so zu wahlen, daJi die Datenverar- 
beitung moglichst zugig erfolgen kann.. Oftmals ist es jedoch 
nicht moglich, eine Konf iguration zu finden, die den ge- 
wunschten Datentransf er in optimaler Weise gewahrleistet . Es 
miissen dann suboptimale Konf igurationen yerwendet werden . 

Wunschenswert ist es hier, eine Moglichkeit zu schaffen, die 
Konf igurierbarkeit zu. erleichtern. 

Es wird dabei welter vorgeschlagen, daB bei einem multidimen- 
sionalen Prozessorf eld aufweisend eine Vielzahl benachbart 
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angeordneter Datenverarbeitungszellen mit Eingangen, die Da- 
ten von Vernetzungswegen erhalten, einer Operanden- 
Verkniipfungseinheit , die diese entsprechend der jeweiligen 
Funktion ihrer Operanden-Verkniipf ungseinheit verknupfen und 
5 Ausgangen, um die Daten verkniipft auf Vernetzungswege aufzu- 
geben, vorgesehen ist, daft die Datenverarbeitungszellen ein 
Aspektverhaltnis aufweisen, das wenigstens 1,5:1, bevorzugt 
2:1 betragt. Dies ermoglicht das bevorzugte Pipelining in den 
PAEs und/oder den Bussen. Dabei ist es bevorzugt, aber nicht 
" 10 zwingend, in insbesondere jeder PAE ein eigenes Pipelining 
vorzusehen, was Takterhohungen ermoglicht 



Damit wird eine wesentliche Verbesserung der Verkniipfbarkeit 
erreicht, ohne dafi teueire Siliziumf lache fur zusatzliche Bus- 

15 verbindungen bereitgestellt werden muJi oder eine besodners 

komplexe Topologie gewahlt werden muli . Die Verbesserungen der 
Verbindbarkeit ergeben sich vielmehr allein daraus, daft der 
Datentransf er quer zu den Zellen verkurzt wird und damit Da- 
ten innnerhalb kurzerer Zeiten, bezogen auf die zum 

20 durchstromen bzw. Verarbeiten in der Zelle erf orderlichen 

Zeiten selbst, von Zelle zu Zelle gelangen. Damit wachst die 
Anzahl der noch als nachste Nachbarn zu bezeichhenden, Zellen, 
^& die also noch innerhalb eines Taktes zu erreichen sind. Es 

ergibt sich etwa bei zweidimensipnalen Feldern eine Anord- 

25 nung, bei der eine Zelle funktional mehr nachste Nachbarn 

besitzt, als sich topologisch bei reiner Geometriebetrachtung 
im zweidimensionalen Fall ergibt. Mit andern Worten ergibt 
sich nur durch die Veranderung des Aspektverhaltnisses funk- 
tional eine mehr als zweidimensionale Konnektivitat . 



30 



Bei den Zellen wird es sich insbesondere um PAE-Zellen mit 
EALU handeln, wie sie per se aus dem vorzitierten Stand der 
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Technik bekannt sind. Bei solchen Zellen wird es sich wie be- 
vorzugt urn grobgranular konf igurierbare Zellen handeln. 

Es ist moglich und bevorzugt, wenn die Datenverarbeitungszel- 
5 len in Reihen und Spalten angeordnet sind. Dies erlaubt eine 
besonders gunstige Auslegung der Zellen, die typisch nahe- 
rungsweise trapezf ormig bzw. rechteckig sind. Es kann dann 
vorgesehen sein, dafi zumindest bei einem Teil der Datenverar- 
beitungszellen Dateneingange vorgesehen sind, um von einer 
10 oberen Reihe Daten zu erhalten und Datenausgange, um an eine 
untere Reihe Daten auszugeben. In einem solehen Fall ergibt 
sich die verbesserte Konnektivitat in beiden Reihen. 



Typisch wird es sich um ein Prozessorf eld handeln, bei dem 
15 die Datenverarbeitungseinheiten EALUs, ALU und/oder register- 
flankierte Zellen sind, d.h. es werden zur Verbindung 
unterschiedlicher Reihen typisch neben den datenverarbeiten- 
den und dabei Daten verzogerungsf rei, d.h. etwa 
schnells.tmoglich weiterleitenden Zellen noch Register vorhan- 
20 den sein, die gerade dazu dienen, Daten bei der Weiterleitung 
zu verzogern, sei es, um unkontrollierte Ruckkopplungsschlei- 
. fen zu verhindern bzw. unterbrechen .(Prinzip der sog. 
te'' Annihilated Feedback Loop Termination- sog. AFTER-Zellen.) 

Oder bei datenauf spaltendem Durchlaufen von Zweigen und nach- 
25 folgendem Wiedervereinigen einen zeitlichen Gleichlauf zu 
erzwingen (Balancing) . 

Mit einem solchen Prozessorf eld ist es nun moglich, eine Kon- 
figuration derart zu wahlen, dafi, wenn Zellen fur die 
30 Konf iguration ausgewahlt und in Funktion und Vernetzung be- 
stimmt werden, wobei eine Vernetzung derart bestimmt wird, 
dali Daten von Zelle zu Zelle ziimindest weitgehend verzoge- 
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rungsfrei ubertragbar sind, vorgesehen ist, daI5 als benach- 
barte Zellen, zwischen denen Daten binnen eines Taktes oder 
einer geringen Taktzahl ubertragbar sind^ auch solche beruck- 
sichtigt werden, die nicht unmittelbar nebeneinander liegen, 
5 sondern in der Breite durch eine Strecke getrennt sind, die 
geringer ist als die Lange der Zelle. Dali eine Heruntertak- 
tung der Zellen im Vergleich zu den Bussen per se moglich 
ist, sei als bevorzugt offenbart. Of f ensichtlich kann aber 
auch in Ausnahitief alien eine in die andere Richtung gehende 
10 Taktabweichung erfolgen oder auf eine solche verzichtet wer- 
den. 

Es sei darauf hingewiesen, dali das angegebene minimale 
Aspektverhaltnis das wenigstens 1,5:1 betragt, bevorzugt noch 
. 15 groiiere Werte anniinint und sich bei sorgfaltiger Auslegung der 
Einheiten durchaus im Bereich zwischen 5:1 und 10:1 bewegen 
kann- 

Die Erfindung wird im folgenden anhand der Zeichnung be- 
20 schrieben, worin gezeigt ist durch 

Fig. CI ein Prozessorfeld der vorliegenden Erfindung 



25 . Nach Fig. 1 umfafit ein allgemein mit 1 bezeichnetes Prozes- 
sorfeld .1 eine Vielzahl benachbart angeordneter 
Datenverarbeitungs zellen 2 mit Eingangen 3, die Daten von 
Vernetzungswegen 4 erhalten, einer Operanden- 

Verkniipfungseinheit 5, die diese entsprechend der jeweiligen 
30 Funktion ihrer Operanden-Verkniipf ungseinheit 5 verknupfen und 
Ausgangen 6, urn die Daten verkniipft auf Vernetzungswege 4 
aufzugeben, wobei die Datenverarbeitungszellen bzw. ihre da- 
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tendurchf lossene Operanden-Verkniipf ungseinheit 5 ein Aspekt- 
verhaltnis von Lange zu Breite aufweisen^ das grofier ist als 
2:1 betragt. 

5 Bei dem Prozessorf eld, 1 handelt es sich vorliegend urn eine 

per se als XPP bekannte Anordnung; alternativ kann es als ein 
Array aus zur Laufzeit partiell rekonf igurierbaren Elementen 
angeordnet sein konnen, etwa als Prozessor, Koprozessor, DSP, 
usw. . Das Prozesssorf eld ist im dargestellten Fall aus 3 Rei- 
10 hen und 4 Spalten aufgebaut, aber nur aus Grunden der 

Ubersichtlichkeit so vergleichsweise klein gewahlt. Typlsch 
wird es grolJer ausgelegt werden. 

Die Datenverarbeitungszellen 2 sind grobgranular konfigurier- 
15 bar und weisen f eingranulare Statemachines auf . Sie sind auf 
per se bekannte Weise rekonf igurierbar, ohne den Betrieb zu 
storen. Auf die hier realisierte, aber nicht naher zu erlau- 
ternde Moglichkeit der zentralen Konf igurationsvorgabe etwa 
durch einen Konf igurationsmanager , der Waverekonf iguration 
20 etc. sei hingewiesen. Die Zellen enthalten als Operanden- 

Verknupf ungseinheit 5 eine ALU-Einheit, in der arithmetische 
Operationen wie Addition, Multiplikation, Subtraktion und. Di- 
vision an bis zu drei eingehenden Operanden durchgefuhrt 
werden konnen, sowie Verknupf ungen wie ISTgrolier? ISTkleiner? 
25 IStNUll? sowie XOR, OR, AND NAND etc. Die ALU-Einheit ist 

mittig angeordnet und flankiert von einem Vorwarts- und einem 
Riickwartsregister, die in per se bekannter Weise uber die An- 
schlusse der Datenverarbeitungszelle 2 gleichfalls mit den 
Vernetzungswegen 4 verbunden werden konnen. 



30 



Die Datenein- und ausgange 3 bzw 6 sind iiber Multiplexer mit 
den Verbindungswegen 4 verbunden. Es ist im vorliegenden Fall 



- 41 - 



Akte: PACT33/PCTE 



ein Bussystem mit einer Vielzahl von Leitungen vorgesehen^ urn 
die Zellen in den Reihen und Spalten konf igurierbar miteinan- 
der zu vernetzen. 

5 Das Aspektverhaltnis der ALU-Einheit betragt nun im darge- 
stellten Beispiel 6:1, d.h. die Zelle ist sehr viel langer 
als breit. 

Die Anordnung wird nun verwendet wie folgt: 

10 

Es wird zunachst ein Prograinin zur Ausfiihrung auf dem Array . 1 
ausgewahlt . Dann wird mit per se. bekannten Mitteln eine Kon- 
figuration bestimmt, die einen optimalen Daten-Durchsatz 
erlaubt. Hierbei wird nun beriicksichtigt , dafi Daten auch an 

15 Zellen, die nicht unmittelbar in der Reihe darunter oder 
seitlich neben einer gegebenen Zelle liegen, sondern z.B. 
drei Spalten seitlich versetzt sind, innerhalb eines Verar- 
beitungs-Taktes Daten erhalten konnen, ohne dali groBere 
Verzogerungen auftreten. Die unter Berucksichtigung dieser 

20 erweiterten Nachste-Nachbar-Def inition erhaltene Konfigurati- 
. on wird auf. das Array auf konf iguriert und ausgefuhrt. 




Die vorliegende Erfindung befasst sich aber nicht nur mit dem 
25 vorteilhaf ten Aufbau eines multidimensionalen Feldes rekonfi- 
gurierbarer Elemente wie bei rekonf igurierbaren Prozessoren, 
sondern auch mit Verfahren zu deren Betrieb, etwa derart, dali 
eine Ubersetzung ^iner klassischen Hochsprache (PROGRAMM) wie 
Pascal/ C, C++, Java etc. auf eine rekonf igurierbare Archi- 
30 tektur ermoglicht wird. 
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Oftmals wird hier nicht das gesamte multidimensionale Feld 
rekonf igurierbarer Elemente samt aller zwischen den Daten 
handhabenden Elemten vorgesehenen Bussystemen^ Verbindungs- 
leitungen usw. zur Umkonf iguration freigegeben, sondern es 
5 besteht vielmehr das Erfordernis, eine neue Aufgabe einem 

kleinen Teilbereich des multidimensionalen Feldes zuzuordnen. 
Es ist tiberdies haufig nicht vorhersagbar, wie dieser Teilbe- 
reich beschaffen sein wird. Dies gilt insbesondere dann, wenn 
auf dem multidimensionalen Feld rekonf igurierbarer Elemente 
10 mehrere Aufgaben parallel abgearbeitet werden miissen, etwa im 
Wege des Multitasking, und/oder nicht vorhergesagt werden 
kann, wann dort, etwa bei Echtzeitanwendungen, welche Res- 
sourcen zwecks Umkonf iguration freigegeben werden. 

15 Prinzipiell besteht die Moglichkeit, einen Code, der auf dem 
multidimensionalen Feld rekonf igurierbarer Elemente abgear- 
beitet werden soil, zur Laufzeit zu iibersetzen, also erst 
dann, wenn die Abarbeitung anderer Aufgaben schon begonnen 
hat, festzulegen, wie der als nachstes auszuf iihrende Code be- 

20 stimmten rekonf igurierbaren Elementen zuzuordnen ist, wie die 
Verbindung zwischen diesen laufen soil, welche Zwischenspei- 
cherungen erforderlich sind usw. Es ist einsichtig, dass eine 
^ solche Vorgehensweise zur Obersetzung einen vergleichsweise 

hohen momentanen . Datenverarbeitungsauf wand erfordert. Gerade 

25 in kritischen Rechnerapplika.tionen, die ein HochstmaB an Re- 
chenleistung erfordern, ist es gewunscht, fur eine solche 
Obersetzung wahrend der Laufzeit . keine zusatzliche Rechenlei- 
stung zu verbrauchen. Es ist daher auch schon ublich, 
Programmcode vor Beginn des Programmes zu kompilieren und 

30 dann Teilkonf igurationen zu bestimmen, die jeweils in das 
Feld hinein konfiguriert werden, sobald dort entsprechende 
Ressourcen frei sind. 
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Ein Problem besteht allerdings darin, dass, gerade bei Echt- 
zeitanwendungen, im Vorfeld nicht feststeht, wie die jeweils 
verfiigbaren Ressourcen angeordnet sind. Dies betrifft einer- 
5 seits die Funktionalitat der zur Datenhandhabung verfugbaren 
Elemente, in die hinein konfiguriert werden konnte, sofern 
nicht alle Daten handhabenden Elemente dieselbe Funktion be- 
sitzen. So ware denkbar^ in einem multidimensionalen Feld 
rekonf igurierbarer Elemente verschiedene Zellen mit Rechen- 

10 werken auszustatten, die fiir iF'liefikomma-Berechnungen 

ausgelegt sind, Elemente vorzusehen, die lediglich Bool'sche 
Daten handhaben, Elemente, die iiber zugeordnete Speicher ver- 
fiigen, Elemente, mit oder in denen Sequenzer vorgesehen 
werden konnen usw. Hier ist eine Ausfiihrung mit Vorkompilie- 

15 rung darauf angewiesen, entweder mit der Umkonf iguration zu 
warten, bis genau jene Zellen zur Verfiigung stehen, die die 
in der Vorkompilierung festgelegten Funktionen und Anordnun- 
gen besitzen, Auch muB bei der Vorkompilierung zudem der 
kleinste, alien Zellen gemeinsame Funktionsumf ang verwendet 

20 werden. Beides verschwendet Ressourcen. Zudem ist meist nicht 
klar,^ wie die fiir die Umkonf iguration f reigegebenen Elemente 
angeordnet sind und welche Verbindungen verfiigbar sind; auch 
dadurch wird gegebenenf alls die Hineinkonf iguration einer 
neuen Aufgabe (Task) massiv erschwert. 

.25 

Das Problem wird noch gravierender, wenn grofie Bereiche des 
multidimensionalen Feldes freigegeben werden und prinzipiell 
die Moglichkeit und/oder der Zwang besteht, mehrere Konfigu- 
rationen fur unterschiedliche Aufgaben. gleichzeitig in das 
30 Feld hinein zu konf igurieren . 
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Es wird somit gemaB einem ersten wesentlichen Aspekt der Er- 
findung ein Verfahren zum Betrieb eines multidimensionalen 
Feldes rekonf igurierbarer Elemente vorgeschlagen^ worin Grup- 
pen zusaininen datenhandhabender Elemente in vorbestimmter 
Weise wahrend der Laufzeit zur Abarbeitung vorgegebener . Auf - 
gaben ira Feld konf iguriert warden und wobei vorgesehen ist, 
dass fiir zuinindest eine abzuarbeitende Aufgabe sine Mehrzahl 
von solchen Eleinentgruppenanordnungen im multidimensionalen 
Feld bestimmt wird, die zur Abarbeitung der vorgegebenen Auf- 
gabe geeignet sind, fiir die Abarbeitung der vorgegebenen 
Aufgabe eine dann besonders geeignete Elementgruppenanordnung 
aus der Mehrzahl ausgewahlt wird und die ausgewahlte Anord- 
nuhg in das Feld hinein konfiguriert wird. 

Die. Erfindung schlagt somit vor, bei der Vorbereitung der ei- 
gentlichen Datenverarbeitung eine Vielzahl von Anordnungen 
bzw. Konf igurationen vorherzubestimmen und dann aus den vor- 
bestimmten Elementgruppenanordnungen eine solche auszuwahlen, 
die fiir die Abarbeitung der . vorgegebenen Aufgabe bei den dann 
gegebenen Feldressourceri besonders gut geeignet ist. Damit 
ist eine wesentliche Verbesserung im Betrieb eines multidi- 
mensionalen Feldes rekonf igurierbarer Elemente im 
Wesentlichen durch eine einfache Erweiterung des. Compilers 
gegeben, mit dem die zuvor programmierten Codes iibersetzt 
werden, und zwar dadurch, dass dieser nicht nur eine einzige 
Konf iguration fiir eine gegebene Aufgabe bestimmt, sondern 
mehrere solcher Konf igurationen und somit ausntitzt, dass kei- 
ne eindeutige Losung fur das Problem besteht, ein Stuck 
gegebenen Hochsprachecode auf ein multidimensionales Feld re- 
konf igurierbarer Elemente zu iibersetzen. Es sei erwahnt, dali 
hier der Begriff Compiler" verwendet wird fiir ein Mittel, 
das Konf ickurationen bestimmt,. unabhangig davon, ob es sich 
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um einen Routerteil^ einen Ubersetzerteil oder einen anderen 
Teil eines Mittels zur Konf igurationsbestiinmung anhand von 
Programmcodes handelt. Dieses Mittel kann mittels Festver- 
drahtung, d. h. als Hardware oder als Sof twareprogramm 
5 realisiert sein. 



Es ist moglich, aus dieser Vielzahl von potentiell moglichen 
Konf igurationen, die zur Abarbeitung eines gegebenen Stuck- 
Codes moglich sind, eine Auswahl anhand der Geometrie zu 

10 treffen, die diese Eleinentgruppenanordnung im Vergleich zu 

jener besitzt> die die im multidimensionalen Feld fiir die Um- 
konf iguration verfugbaren bzw. vermutlich bald verfugbar 
werdenden Elemente besitzen. So kann durch einen einfachen 
Mustervergleich versucht werden, eine Konf iguration, d. h. 

15 Elementgruppenanordnung, auszuwahlen, die moglichst alle der 
frei gewordenen oder frei werdenden Elemente abdeckt bzw. 
moglichst wenig Elemente des multidimensionalen Feldes unge- 
nutzt lasst. Wenn lediglich auf die Geometrie Rucksicht 
genommen wird, etwa well alle Daten handhabenden Elemente des 

20 multidimensionalen Feldes den fur die Hineinkonf iguration er- 
f orderlichen Funktionsumf ang besitzen, so kann die Auswahl 
mit per se bekannten Algorithmen wie bei der Schnittmusterop- 
timierung erfblgen- Es kann dabei entweder auf die bereits 
verfugbaren Elemente Bezug genommen werden. oder es kann, ins- 

25 besondere im Hinblick darauf, dass die Umkonf iguration 

oftmals die Obertragung von Konf igurationsdaten zu den Ele- 
menten umfasst und eine solche 

Umkonf igurationsdateniibertragung Zeit in Anspruch nimmt, vor- 
gesehen werden, dass auch vermutlich bald verfiigbare Elemente 
30 mit bei der Auswahl der jeweils optimalen Geometrie beruck- 

sichtigt werden. Dabei kann ausgenutzt werden, dass es haufig 
moglich ist, vorherzusagen, dass bestimmte Elemente bald fiir 
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die Umkonf iguration verfugbar werden, etwa wenn sie Daten fur 
die Weiterverarbeitung von Zellen erhalten haben, die bereits 
ihre Umkonf igurierbarkeit angedeutet haben und die Anzahl der 
noch erf orderlichen Verarbeitungstakte^ der hierzu daten- 
5 stromabwarts liegenden Zellen endlich und abschatzbar oder 
bekannt ist. Derartige Information ist erf indungsgemaJi als 
Umkonf igurierbarkeits-Vorhersage verwaltbar. Dali zu den ver- 
fiigbaren und/oder benotigten Elementen auch Busverbindungen, 
Leitungen etc. zahlen^ sei erwahnt. 

10 

Die Auswahl der optimalen Konf iguration kann dabei in einem 
Praprozessor oder einem Teilbereich des multidimensionalen 
Feldes der rekonf igurierbaren Elemente erfolgen und insbeson- 
dere von einem Datenverarbeitungsprogramm und/oder -mittel 

15 ubernommen werden, das die Durchfiihrung der verschiedenen . 
Aufgaben zeitlich koordiniert, Priorisierungen vornimmt usw. 
Es kann sich hierbei insbesondere um einen Teil eines Be- 
triebssystems handeln, sofern das multdimensionale Feld 
rekonf igurierbarer Elemente als Prozessor oder Koprozessor 

20 ausgefuhrt ist. Die Verwendbarkeit der CT, eines Schedulers 

fur Hyperthreading, Multitasking, Multithreading usw. sei er- 
wahnt. Auf entsprechende weitere Telle der vorliegenden 
Anmeldung sei diesbeziiglich verwiesen. DaI5 solche Einheiten 
hard- und/oder sof twaremaliig implementierbar sind, sei er- 

25 wahnt. 

Gerade dann, wenn Konf iguratiohsdaten aus einem Speicher ein- 
gelesen werden, der nicht vernachlassigbare Zugrif f szeiten 
besitzt, bzw. wenn sie, sollte eine Echtzeitbestimmung einer 
30 Konf iguration gewunscht werden, mit nicht vernachlassigbaren 
Generierungszeiten generiert werden, ist es wiinschenswert , 
zunachst einen Kenndatensat.z vorzusehen, der gegeniiber dem 
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eigentlichen Konf igurationsdatensatz in der Grosse reduziert 
ist und dann eine Auswahl nur auf Grund dieses Kenndatensat- 
zes zu treffen. So kann etwa beim Laden einer neuen 
Konf iguration aus einem langsamen Speicher wie von einer 
5 Festplatte zunachst lediglich ein Kenndatensatz bzw. eine 
Kenndatensatzgruppe heruntergeladen warden, der die Umrisse 
der Konf iguration betrifft. Da ein solcher Umr is s kenndaten- 
satz in der GroBe gegenuber deiti vollstandigen 

Konf igurationsdatensatz typisch sehr reduziert sein wird, ist 

10 . es auch moglich, eine Vielzahl von Kenndatensatzen fur eine 
Vielzahl unterschiedlicher Konf igurationen vorab in einen 
Hauptspeicher zu laden, der einen sehr schnellen Zugriff er- 
laubt, an Hand der unterschiedlichen Konf igurationsdatensatze 
eine schnelle Auswahl zu treffen und dann aus dem langsamen 

15 Speicher die kompletten Konf igurationsdaten zur ausgewahlten 
Konf iguration herunter zu laden. Es sei darauf hingewiesen, 
dass es in solchen Fallen auch moglich ist, einen Teil der 
Konf igurationen vorneweg miteinzulesen, etwa dann, wenn.ab- 
sehbar ist, dass bestimmte Konf igurationen typisch bevorzugt 

20 sind, sei es, weil statistische Auswertungen des typischen 

Datenverarbeitungsbetriebes fiir eine Vielzahl von multidimen- 
sionalen Feldern rekonf igurierbarer Elemerite oder fur ein . 
einzelnes multidimensionales Fieid dies ergeben haben, etwa 
weil zu einer Gruppe von Anwendungen wie im UMTS-Base- 

25 Station-Bereich durch Analyse typischer Aufgaben festgestellt 
wurde, dass bestiminte Umkonf igurationen besonders haufig auf- 
treten, oder weil fiir einen einzelnen Benutzer festgestellt 
wurde, dass immer wieder dieselben Anwendungen parallel in 
bestimmter Weise in das Feld hinein konf iguriert werden mus— * 

30 sen. Das Vorab-Mitladen bestimmter Konf igurationen kann auch 
dann s.innvoll sein, wenn sich diese Konf igurationen durch ei- 
ne besonders einfache Geometrie auszeichnet, etwa weil sehr 
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kleine Volumina des multidimensionalen Feldes rekonf igurier- 
barer Elemente davon iiberdeckt werden (Volumina nimmt hier 
auf das Volumen des multidimensionalen Feldes Bezug, bezeich- 
net also bei zweidimensionalen Felder rekonf igurierbarer 
5 Elemente die Flache bzw. Flachengeometrie der fur die Umkon- 
figuration verfiigbaren rekonf igurierbaren Elemente etc. ) . 

Es ist auch moglich und insbesondere bei der Abarbeitung kom- 
plexer Auf gabenstellungen^ sei es durch die Abarbeitung 

10 besonders rechenintensiver Probleme, sei es im Multitasking^ 
Multithreading oder bei anderen Formen der. Parallelabarbei- 
tung von Dateh, auch bevbrzugt^ zu iiberpriifen, ob mehrere^ 
insbesondere gleich priorisierte Elementgruppenanordnungen 
fiir unterschiediiche Aufgaben simultan durch. geeignete Aus- 

15 wahl in das Feld hinein konf igurierbar sind. Dabei kann^ 

abhangig von der Priorisierung einer bestimmten Aufgabe vor- 
gesehen werden, dass die fiir die Abarbeitung einer 
vorgegebenen Aufgabe zur Verfiigung gestellte Flache oder Ab- 
arbeitungszeit groJier. oder kleiner. ausfallt, etwa indem durch 

20 Aufbau von Sequenzern mit den Daten handhabenden Elementen 

die Grofie einer Konf iguration unter Verlangsamung der Daten- 
abarbeitung verringert wird.. 

Es kann auch erwunscht sein, dass zunachst eine erste Ele- 
25 mentgruppenanordnung in das Feld hinein konfiguriert wird und 
begonnen wird> mit dieser Elementgruppenanordnung die Aufgabe 
abzuarbeiten, bis ein vorgegebenes Ereignis auftritt und dann 
unter zumindest partieller Rekonf iguration mit der Aufgaben- 
abarbeitung in einer weiteren Elementgruppenanordnung 
30 fortgefahren wird. Hierbei kann etwa vorgesehen werden, dass - 
zur Erzielung einer bevorzugten Geometrie von. Konf igurationen 
auf dem multidimensionalen Feld, etwa streif enf ormig hinter- 
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einander angeordneten Zellen fur jede Aufgabe^ zu festgeleg- 
ten Taktzeiten, etwa alle tausend, zehntausend oder 
hunderttausend Takte, die Abarbeitung aller oder eines Teiles 
aller Konf igurationen unterbrochen wird, die Ergebnisse wie 
5 -erf orderlich zwischengespeichert werden, auch was nur in ei- 
ner Konf iguration intern erf orderliche Daten wie Schleifen-, 
Zahlerstande usw. angeht, und dann eine Neukonf iguration mit 
entsprechenden, bevorzugten Geometrien vorgenommen wird, um 
so ein allmahliches Zerfasern von Konf igurationen zu vermei- 
10 den, was schon aufgrund des erhohten Bedarfs an Busleitungen 
unerwunscht ist. 

Alternativ und/oder zusatzlich ist es auch moglich, selbst- 
faltende Konf igurationen vorzusehen, wobei etwa zunachst mit 

15 der Abarbeitung einer Konf iguration uber das gesamte Array 
begonnen wird, und sich dann, sobald zusatzliche Ressourcen 
durch eine andere Aufgabe angefordert werden, diese erste 
Konf iguration mehr oder minder selbsttatig zusammenzieht , et- 
wa durch Sequenzerbildung mit einem Element, um Elemente fur 

20 die neue Aufgabe freizugeben. Dieses Zusammenziehen kann 

durch Vorgabe neuer, Platz sparenderer Konf igurationen fur 
ein und dieselbe Aufgabe erreicht werden, insbesondere dann, 
wenn diese Platz sparenderen Konf igurationen in bei den Daten 
handhabenden Elementen vorgesehenen Konf igurationsspeichern 

25 mit abgelegt werden. Auf . die Anmeldung zur Wave- 

Rekonf iguration sei dabei nur beispielsweise hingewiesen. Es 
ergibt sich dann eine Situation^ bei der Konf igurationen all- 
mahlich enger und enger zusammenrucken.. 

30 Die Auswahl einer vorgegebeneh Elementgruppenanordnung, die 
in ein Feld hinein zu konf igurieren ist, kann, abgesehen von 
der verfugbaren Geometrie, auch von anderen Parametern abhan- 
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gig gemacht werden, Hierzu zahlt unter anderem die erzielbare 
Abarbeitungsgeschwindigkeit , die Prioritat einer Aufgabe 
und/oder der Energieverbrauch, der zur Abarbeitung einer vor- 
gegebenen Aufgabe in einer vorgegebenen Zeit erforderlich 
5 ist. Es sei darauf hingewiesen, dass mehrere Parameter 

gleichzeitig betrachtet werden konnen, sei es dadurch, dass 
zunachst anhand eines ersten Parameters wie des benotigten 
Feldvolumens als gleichwertig angesehene Konf igurationen 
durch Betrachten eines zweiten Parameters verworfen werden, 
10 sei es, indem, etwa mit Methoden der unscharfen Logik, mehre- 
re Parameter gleichzeitig soweit wie moglich optimiert 
werden. 

Die Erfindung wird nun im Folgenden nur beispielsweise anhand 
15 der Figuren erlautert, worin gezeigt ist durch 

Fig. Dl ein multidimensionales Feld Daten handhabender 
Elemente in teilweise zu rekonf igurierendem Zu- 
stand; 

20 Fig. D2 Beispiele fur unterschiedliche Konf igurationsgeo- 

metrien; 

Fig. D3 ein teilweise zur Lauf zeit iimkonf igurierter Pro- 
zessor. 

25 Nach Fig. 1 umfasst eine allgemein mit 1 bezeichnete Daten- 
verarbeitungsvorrichtung 1 ein multidimensionales Feld 
rekonf igurierbarer Elemente 2 sowie einen Praprozessor 3, der 
Konf igurationen in das multidimensionale Feld 1 liber geeigne- 
te Datenbusse 4 einspeist und Informationen iiber 

30 rekonf igurierbare Elemente aus dem multidimensionalen Feld 2 
mehrere Elemente erhalt sowie mit einem Speicher 5 mit lang- 
samem Zugriff verbunden ist, in dem Konf igurationen fur in 
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dem multidimensionalen Feld 2 abzuarbeitende Aufgaben vorab 
abgelegt sind. 

Der multidimensionale Prozessor 1 ist im vorliegenden Bei- 
5 spiel eine XPU-Architektur , die PAE als konf igurierbare 

Elemente aufweist und nach PACT02, 04, 08, 10, 13 aufgebaut 
ist. Er erhalt Daten von Eingabe-/Ausgabe-Schnittstellen 6 in 
Echtzeit zur Abarbeitung, wobei nicht vorhersehbar ist, wie 
diese Daten eintreffen und/oder abzuarbeiten sind. Es konnen 
10 hierftir eine Tastatur, Bilder abrufende Kameras, A/D-Wandler 
usw. vorgesehen sein. 

Das multidimensionale Feld 2 besteht, zur Vereinf achung der 
Veranschaulichung, obwohgl technologisch keiniesfalls zwin- 

15 gend, vorliegend nur aus einer Reihe ausschlielilich 

identischer datenhandhabender Elemente, zwischen denen geeig- 
nete Vernetzungen uber Busse und dergleichen konf igurierbar 
sind. Aus Grunden der Anschaulichkeit wird vorliegend von un- 
begrenzten Busressourcen ausgegangen, obgleich rein praktisch 

20 die typische Anwendung auch solcher Ressourcen und deren 

Knappheit bei der Vorabbestimmung multipler Konf igurations- 
moglichkeiten berucksichtigt wird. Die datenhandhabenden 
. Elemente sind im vorliegenden Fall geeignet, sequenzartig die 

Befehle abzuarbeiten, wie dies per se bekannt ist, das heilSt, 

25 es ist moglich, Sequenzer iiber einzelne Zellen oder Gruppen 
derer aufzubauen. DaB hierbei ein Zeitteilungsmultiplexing 
moglich ist, sei erwahnt. Dies erlaubt eine entsprechende 
Faltung mehrerer Operationen, dann dann bei grofien Arrays 
bzw- mehr Platz auch ausgefaltet werden konnen. 

30 

Das multidimensionale Feld 2 ist laufzeitrekonf igurierbar, 
das heilit es ist moglich, einzelnen der datenhandhabenden 
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Elemente oder Gruppen derer neue Aufgaben wahrend der Lauf- 
zeit zuzuordnen, ohne den Betrieb der Gesamt-Anordnung oder 
anderer Elemente bzw. Gruppen derer insgesamt zu unterbre- 
chen. Wie bevorzugt und per se bekannt sind den 
5 datenhandhabenden Elementen Konf igurationsspeicher lokal zu- 
geordnet, genau so wie Register, namlich Forward- und 
Backward-Register/ Busleitungen, f eingranulare Zustandsma- 
schinen zum Austausch von Triggersignalen untereinander und 
mit der Praprozessoreinheit 3 usw. Auf die Moglichkeit der 
*" 10 Ausgestaltung der rekonf igurierbaren Elemente nach PCT-DE 

97/02949, PCT-DE 97/02998, PCT-DE 98/00334, PCT/DE 99/00504, 
PCT/DE 99/00505, PCT/DE 00/01869 usw. sei hingewiesen. Die 
vorgenanhten Schutzrechte und die weiteren Schutzrechte des 
Anmelders zu rekonf igurierbaren Prozessoren, deren Teilen und 
15 Verfahren zu deren Betrieb sind zu Of f enbarungszwecken voll- 
umfanglich integriert. 

Der Praprozessor 3 ist dazu ausgebildet, Konf igurationen in 
das multidimensionale Feld hinein zu laden und zwar iiber Lei- 

20 tungen 4, wenn er aus dem multidimensionalen Feld die Meldung 
erhalt, dass einzelne Elemente oder Gruppen derer rekonf igu- 
rierbar sind. Der Praprozessor 3 enthalt einen lokalen 
Speicher (Cache) und ist mit einem weiteren Speicher 5 (Hard- 
disk, RAM) verbunden, auf den langsamer zugegriffen werden 

25 kann und auf dem Konf igurationsdaten abgelegt sind. Geeignet 
ist etwa eine CT. 

Es sei darauf hingewiesen, dass es nicht erforderlich ist, 
den Praprozessor 3 als externes Bauteil vorzusehen. Die ge- 
30 zeigte Darstellung wurde ausschlielilich aus didaktischen 

Grunden gewahlt. Er kann integriert sein mit dem multidimen- 
sionalen Feld 2 auf einem einzelnen Chip und/bder seine 
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Funktion kann durch einzelne Daten handhabende Elemente 2 des 
Prozessorf eldes ausgefiihrt warden. 

Uber die Leitungen 4 warden Konf igurationsdaten und Konfigu- 
5 rationsanf orderungen iibertragen. Auf die Implementierung von 
Rdy/Ack-Protokollen, Vorab-Konf iguration von Elementen in 
elementennahen Spaichern etc., die moglich, aber nicht zwin- 
gend ist, wird hingewiesen. 

" 10 Im Speicher 5 sind nun eine Vielzahl von Konf igurationen fur 
unterschiedliche Aufgaben und Kenndaten hierzu abgelegt. Dies 
wird fur ein einf aches Beispiel mit Bezug auf Fig. 2 erlau- 
tert . 



15 Nach Fig. 2 sind etliche Konf igurationen fur zwei Aufgaben a) 
und b) abgelegt. Wie ersichtlich, sind fur die Aufgabe a) 
insgesamt vier Konf igurationen abgelegt, die alle dieselbe 
Funktion ausfuhren^ aber unterschiedliche Verbindungen der 
Zellen untereinander haben und sich insbesondere hinsichtlich 

20 ihrer aulieren geometrischen Gestalt unterscheiden, in der die 
Zellen angeordnet sind. 

Wie ersichtlich, sind beispielsweise drei Konf igurationen 
vorabgelegt, in denen sieben datenhandhabende Elemente wie 

25 PAEs benotigt werden und. eine Konf iguration, in der unter 
Ausnutzung der Sequenzereigenschaf t der datenhandhabendeh 
Elemente nur vier Elemente benotigt werden. Die geometrische 
Form der jeweiligen Konf iguration ist dabei wie durch die 
Zahlen in Klammern angedeutet, gieichf alls mitabgelegt . Die- 

30 ser Kenndatensatz umfasst eine erste Ziffer, die angibt, 
wieviele Spalten Abstand die aufiersten Zellen links und 
rechts voneinander haben; es folgen dann nach einem Komma die 
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Anzahl der Elemente in einer Spalte, die benotigt werden- 
Sind in einer Spalte Reihen frei, d. h. nicht belegt, steht 
gleichfalls ein b in der Kennung. 1st dabei eine Spalte frei- 
gelassen^ das heilit von der jeweiligen Konf iguration bis auf 
5 -Busse nicht belegt, so steht hierfur ein b in der Konfigura- 
tion. Dies ist ersichtlich an den Konf igurationen I und II. 
Die Daten zu einer Spalte sind von jenen der nachsten Spalte 
durch Komma getrennt.. Ahnliche Konf igurationsdaten sind auch 
fiir eine zweite Konf iguration abgelegt b) . 

10 

Die. Anordnung wird verwendet wie folgt: 

Wenn im multidimensionalen Feld rekonf igiirierbarer Elemente 
Ressourcen flir die Rekonf iguration freigegeben sind, wie dies 

15 . durch die ^^0" in Fig. 2 dargestellt ist, so ladt der Prapro- 
zessor 3 aus dem Speicher 5 zunachst die wenig umf angreichen 
und damit schnell zu ladenden Kennsatze zu den Konf iguratio- 
nen. Er bestimmt dann, welche Aufgabe schnell abzuarbeiten 
ist und welche Konf igurationen gemeinsam besonders gut in das 

20 Feid eingeladen werden konnen. Dies geschieht durch Vergleich 
der maximalen Spaltenbreite einer itioglichen Konf iguration mit 
der tatsachlich verfiigbaren Spaltenbreite. Zur Aufgabe a) 
konnen so Konf iguration III und IV verworfen werden, die zu- 
viel Spaiten benotigen.^ Aus den verbleibenden sind aufgrund 

25 der geometrischen Form die Konf igurationen I und II gleich- 
falls zu verwerfen. Es wird dann untersucht, welche 
Konf iguration von b) zu laden ware. Hier sind per se alle 
drei Konf igurationen ladbar. 

30 Nun wird untersucht, ob es eine Moglichkeit gibt, von den 
verbleibenden Konf igurationen zu den Aufgaben gleichzeitig 
zwei Konf igurationen in das Feld zu laden. Dazu werden die 
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Konf igurationen in unterschiedlicher Weise aneinander gesetzt 
und es wird die benotigte maximale Spalten- und Reihenzahl 
mit der verfugbaren Maximalzahl verglichen. Es wird so fest- 
gestellt, dali sich eine optimale Ausnutzung der 
f reigewordenen Elemente ergibt, wenn die Konf iguration lb und 
die Konf iguration la unmittelbar iibereinander angeordnet wer- 
den. Diese Konf igurationen werden dann in das Prozessorf eld 



Daraufhin kann die Datenverarbeitung mit einer Konf igurati- 
onsanordnung wie in Fig. 3 gezeigt fortgesetzt werden. 
Es sei erwahnt, dass in Fallen, in denen unterschiedliche Da- 
ten handhabende Elemente vorgesehen werden, die entsprechende 
Information gleichfalls im Kenndatensatz abgelegt werden 
kann. 

Wie vorstehend ersiehtlich, ist die Art und Weise, wie ein 
gegebenes Prozessorf eld fiir eine vorgegebene Weise konfigu- 
riert werden mufi, nicht eindeutig. Dies gilt insbesondere 
dann, wenn es sich um komplexe Felde.r handelt, bei denen etwa 
zumindest zum Teil in den Leitungen Register vorgesehen sind 
und weiter mit diesen insbesondere auch Additionen und/oder 
Vergleiche von Daten durchzuf iihren sind, wie dies auch in 
arithmetische Logikeinheiten (ALUs) aufweisenden Logikzellen 
des Feldes der Fall sein kann. Oft ist es auch moglich 
und/oder notig, etwa bei Inbetriebnahme, aus vielen Konf igu- 
rationen mehrere mogliche zu wahlen. 

Es ist bereits vorgeschlagen worden, eine Konf iguration aus 
mehreren per se verwendbaren auszuwahlen anhand der momenta- 
nen Konf igurierbarkeit unter geometrischen Aspekten, der 
Ressourcenverfiigbarkeit und/oder auszuwahlen aufgrund von Ge- 



geladen. 
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schwindigkeitsaspekten. Dies kann die Auswahl erleichtern, 
stellt aber oftitials nur unzureichende Kriterien dar. Es ist 
wunschenswert , die Konf igurationsauswahl waiter verbessern zu 
konnen. Es ist weiter oftmals moglich, eine bestimmte Daten- 
5 verarbeitungsauf gabe selbst auf unterschiedliche Weise 

durchzufuhren. So ist etwa eine Reihe von Algorithmen be- 
kannt, die es erlauben, einen Satz Daten auf unterschiedliche 
Weise zu sortieren. Auch hier ist es erf orderlich, zwischen 
unterschiedlichen Algorithmen, die prinzipiell geeignet sind, 
" 10 eine bestimmte Datenverarbeitungsauf gabe zu bewaltigen, auf- 
grund von objektivierbaren Kriterien zu wahlen. DaB diese 
Wahl zur Laufzeit und/oder davor erfolgen kann, sei erwahnt. 
Insgesamt ist es somit wiinschenswert , Auswahlmoglichkeiten 
bei der Datenverarbeitung mit konf igurierbaren multidimensio- 
15 nalen Prozessorf eldern zu verbessern, etwa urn bei 

f estgespeicherten Konf igurationen sicherzustellen, dali eine 
bereits anwendungszweckoptimierte Auswahl getroffen wurde. 

Die vorliegende Erfindung schlagt somit in einem ersten 
20 Grundgedanken ein Verfahren zur Auswahl eines aus einer Viel- 
zahl von Wegen zur Erzielung eines 

Datenverarbeitungsergebnisses bei der Datenverarbeitung uriter 
zumindest moglicher Verwendung multidimensionaler. Felder kon- 
f igurierbarer Datenhandhabungselemente vor, bei welchem 
25 vorgesehen ist, dali den Datenhandhabungselementen konfigura- 
tionsabhangig verbrauchsbezogene kennzeichnende GroBen 
zugeordnet werden und eine Wegauswahl anhand der Zuordnung 
erfolgt- 

30 Ein weiterer Grundgedanke kann somit in der Erkenntnis gese- 
hen werden, daB bestimmten Datenverarbeitungswegen typische 
Leistungs- bzw. Energieaufnahmewerte zugeordnet werden kon- 
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nen, urn dann eine Wegauswahl unter Beriicksichtigung derselben 
vorzunehitien . Als Erzielung eines Datenverarbeitungsergebnis- 
ses wird auch eine bestimmte Art und Weise einer 
Zwischenergebnisberechnung und/oder einer Datenhandhabung 
5 etc. betrachtet. Durch die Zuordnung verbrauchskennzeichnen- 
der GroBen wird also eine wesentliche Ojektivierung der 
Wegauswahl moglich. 

Die Auswahl eines Weges kann beispielsweise die Wahl eines 
'■10 gegebenen Algorithmus aus einer Vielzahl unterschiedlicher 
. Algorithmen umfassen, sei es fiir Aufgaben wie das Sortieren 
von Daten, bestimmte mathematische Transf ormationen oder de.r- 
gleichen. Liegen in einer Programmmodul-Bibliothek etwa 
mehrere Sortieralgorithmen, Algorithmen zur Bestimmung einer 

15 Fourier-Transf ormierten oder dergleichen vor, so kann z- B. 

zu jeder eine verbra:uchskennzeichnende Grolie ermittelt werden 
und es wird dann unter Berucksichtigung derselben eine Aus- 
wahl vorgenommen . So wird es moglich^ Algorithmen zu.wahlen^ 
die beispielsweise einen besonders niedrigen Energieverbrauch 

20 besitzen. Dies kann. fur mobile Anwendungen wie bei Laptops, 

Funktelef onen und dergleichen sinnvoll sein, bietet aber auch 
in Bereichen Vorteile, bei denen sehr rechenintensive Aufga- 
ben zu bewaltigen sind, etwa in Servern, Basestations usw. , 
wo die in einer Verarbeitungseinheit erzeugte Leistung wegge- 

25 kuhlt und/oder abgefuhrt werden muB. Durch die Erfindung 

konnen so Systemgesamtkosten rtiinimiert werden. Auch kann etwa 
ein Place&Route-Algorithmus die Optimierung ausnutzen, etwa 
zur Erzielung niederenergetischer Anordnungen. Dies ist be- 
sonders bevorzugt und wird als fur sich erfinderisch 

30 angesehen. 



- 58 - 



Akte: PACT33/^jp 

Es ist welter moglich, fur ein und denselben Algorithmus eine 
Vielzahl unterschiedlicher Konf igurationen vorzusehen, etwa 
unter Berucksichtigung verschiedener , simultan und/oder se- 
quenziell auf das multidimensionale Feld zu konf igurierender 
5 Teilauf gaben, und dann eine Auswahl aus diesen unter Auswer- 
tung der jeweils zugeordneten GroBe vorzunehmen. 

Weiter ist es moglich, unter Anwendung des erf indungsgemalien 
Verfahrens dariiber zu befinden, ob eine gegebene Aufgabe der 

10 Datenverarbeitung, bzw. eine Teilaufgabe, deiti betrachteten 

multidimensionalen Feld konf igurierbarer Datenhandhabungsele-- 
mente und/oder einem anderen Element zur Datenverarbeitung 
aulierhalb des multidimensionalen Feldes zugeordhet werden 
soil; so kann etwa dariiber entschieden werden, ob dann, wenn 

15. das multidimensionale Feld als Koprozessor dient, eine be- 
stimmte Teilaufgabe besser auf einer rein sequenziell 
arbeitenden CPU oder dem rekonf igurierbaren, typisch.als Da- 
tenf luliprozessor oder dergleichen arbeitenden 

multidimensionalen Feld abgearbeitet werden soil, Es ist auch 
20 moglich, liber das Erfordernis oder die Sinnhaf tigkeit dedi- 
zierter Schaltkreise wie ASICs fiir bestimmte . Auf gaben zu 
befinden. 

Typisch wird. es sich bei dem Feld konf igurierbarer Datenhand- 
25 habungselemente um ein zweidimensionales Feld handeln, Es sei 
erwahnt, dafi die Erfindung fiir Felder wie FPGAs, XPP-Prozes- 
soren usw. anwendbar ist. Es ist besonders bevorzugt fiir zur 
Laufzeit konf igurierbare, insbesondere partiell zur Laufzeit 
ohne Storung nicht umzukonf igurierende Elemente teil-rekon- 
30 f igurierbarer Prozessorf elder . 
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In typischen Anwendungen wie bei XPP-Feldern werden als zu 
beriicksichtigende Datenhandhabungselemente insbesondere zu- 
mindest einige^. bevorzugt alle der Elemente Busse, Register^ 
ALUs, RAMs, I/0~Ports sowie konf igurierende Einheiten (CT's) 
5 erfafit. Es sei darauf hingewiesen, dali von bestimmten dieser 
Telle nur eine abgeschatzte oder partielle Verbrauchsberiick- 
sichtigung erforderlich ist; so brauchen etwa bei Bussen 
lediglich bestimmte Treiberstuf en und dergleichen beriicksich- 
tigt werden. Weiter kann es erforderlich sein, auch 
10 Taktbeschaltungen mit zu erfassen, sei es, well in bestimmten 
Datenverarbeitungswegen . eine Voll- oder Teilabschaltung eines 
Taktzweiges moglich ist, sei es, well bestimmte Schaltungsbe- 
reiche mit einem unterschiedlichen Takt versorgt werden 
konnen oder miissen. 

15 

Es ist bevorzugt, wenn der kennzeichnende Wert nur grob abge- 
schatzt wird, etwa dahingehend, daB festgestellt wird, ob ein 
bestimmtes Element momentan verwendet wird und/oder konfigu- 
riert ist, oder ob es stattdessen nicht verwendet wird und 

20 gegebenenf alls sogar von einer Spannungsversorgung bis auf 
einen Wake-up-Schaltkreis und/oder von einer Taktverso.rgung 
zumindest weitgehend abgeklemmt ist.. Es ist also nicht erfor- 
derlich, eine absolut exakte Verbrauchskennzeichnung 
vorzunehmen, etwa unter Festlegurig des Verbrauchs der spezi- 

25 fischen algebraischen Operation, die einer jeweiligen 

arithmetisch-logischen Einhe.it aktuell und/oder dauerhaft zu- 
geordnet wird. Vielmehr kann es ausreichend sein, die 
verbrauchskennzeichnende GroBe nur dahingehend zu bestimmen, 
ob und wie wait taitsachlich das jeweilige Element im Augen- 

30 blick verwendet wird. Ausnahmen hiervon sind moglich. Eine 

Ausnahme kann insbesondere gemacht werden fiir Operationen wie 
Multiplikationen, bei denen sehr groBe Schaltkreisf lachen mit 
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Leistung versorgt werden miissen. In einem solchen Fall kann 
eine weitere Detaillierung vorgesehen werden. 

Es ist moglich und bevorzugt, jedem unterschiedlichen Daten- 
5 handhabungselement unterschiedliche Kennzahlen, wie strom- 
und/oder leistungsaufnahmebezogener Grolien als verbrauchs- 
kennzeichnende Grofien zuzuordnen. Dieses kann gegebenenf alls 
in taktabhangiger Weise (Leistungsauf nahme pro Taktf requenz) 
geschehen. Welter, ist es moglich, eine Auswahl unter Beriick- 
10 sichtigung eines Suminenwertes vor zunehmen, also uber die 

Betrachtung des Gesamtverbrauchs oder. abgeschatzten Gesamt- 
verbrauchs eines betrachteten Weges zu entscheiden. 

Die Auswahl wird typisch nicht alleine unter Beriicksichtigung 
15 der verbrauchskennzeichnenden Grolien erfolgen, sondern kann 

andere Parameter miterfassen, etwa eine erf orderliche Ausfuh- 
rungszeit, erf orderliche Ressourcen auf einem 

multidimensionalen Feld^ eine aktuelle oder erwartete Prozes- 
sorauslastung durch andere Aufgaben und/oder eine aktuell 
20 gewunschte beziehungsweise erwartete oder zulassige Lei- 
stungsauf nahme. Die Kennzahlen sind durch MeBwerte und/oder 
Hardware- bzw. Syntheseanalysen erhaltlieh und insbesondere 
in Look-Up-Tabellen hinterlegbar . 

25 Die Auswahl des jeweiligen Weges kann vor der eigentlichen 

Datenverarbeitung erfolgen, etwa bei der Festlegung von spa- 
ter zu laderiden Konf igurationen unter mehreren, theoretisch 
implementierbaren Konf igurationen- In einem solchen Fall ist 
es besonders ist bevorzugt, wenn die kennzeichnende Grolie 

30 wahrend der Simulation der Datenverarbeitungsf unktionen mit 
ermittelt wird.. Alternativ kann vorgesehen werden, dali die 
Auswahl unter verschiedenen moglichen Wegen wahrend der Lauf- 
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zeit erfolgt- In einem solchen Fall werden etwa mehrere mog- 
liche Algorithmen, z. B. urn Daten zu sortieren^ 
bereitgestellt ^ es wird dann abgefragt;. wie viele einzelne 
Daten zu sortieren sind und wie gegebenenf alls der Ordnungs- 
5 grad dieser Daten ist und es wird erst danach eine Auswahl 

unter verschiedenen, vorher bestimmten Algorithmen anhand der 
ihnen zugeordneten parametrierten Verbrauchskennzeichnungs- 
grofJen wie der Gesamtleistungsauf nahme usw. vorgenommen. 
Analog kann auch eine Konf iguration zur Laufzeit abhangig von 
10 z. B. einer momentan moglichen oder gewiinschten . St romauf nahme 
erfolgen. 

Dieser Aspekt der Erfindung wird im folgendeh nur beispiels- 
weise beschrieben^ ohne dafi Bezug genoininen wird auf eine 



Figur . 



Es wird zunachst eine gewunschte Art der Daten-Bearbeitung 
festgelegt, die auf dem Prozessorf eld durchgefiihrt werden 

20 soil. Beispielsweise wird ein Viterbi-Algorithmus program- 
itiiert und eine fiir das betrachtete Prozessorf eld geeignete 
Konf iguration bestiinint. Es wird dann ermittelt, welche Ein- 
heiten auf dem Prozessorf eld verwendet werden und uber wie 
viele Takte dies geschieht. Bei der Betrachtung der verwende- 

25 ten Elemente werden in einem Beispiel berucksichtigt ALUs^ 

Vorwarts- und Riickwarts-Register (FREG und BREG) sowie Schal- 
ter in Bussen (LSW und RSW) . Es wird dann der gesamte 
Energieverbrauch je Elementart bestimmt und anschlieiiend der 
gesamte Energieverbrauch aller unterschiedlichen Einheiten. 

30 Die Energieverbrauchswerte fiir ein einzelnes Element je Takt 
sind ihrerseits abgeschatzt aus Simulationen der Hardware- 



- 62 



Akte: PACT33/P 



schaltungen bei der betrachteten Architektur und sind fiir das 
Verfahren der Erfindung tabellarisch hinterlegt. 



10 



15 



In dem betrachteten praktischen Beispiel sind fiir die Imple- 
mentierung eines gegebenen Viterbi-Algorithmus 10 ALUs, 17 
Vorwartsregister, 23 Ruckwartsregister sowie 30 Busschalter 
(LSW) in einer und 35 Schalter in der entgegengesetzten Rich- 
tung (RSW) erf orderlich. Bei einem Energieverbrauch von 4,85 
pW/Hz je ALU, 7,01 pW/Hz pro FREG, 7,02 pW/Hz je BREG sowie 
2,03 pW/Hz je Busschalter ergibt sich folgende Tabelle: 

Number of cycles: 1582 

Energy consumption 



Einzelkennzahl 



Gesamtkennzahl 



20 



25 



30 



ALU: 


10,00 


X 


4 , 85 




48, 50 


FREG: 


17,00. 


X 


7,01 




119, 17 


BREG : 


23,00 


X 


7,02 




161,46 


LSW: 


30,00 


X 


2,03 




60, 90 


RSW: 


35,00 


X 


2,03 




71, 05 



Total: 



4 61,08 pW/Hz 



Es kann nun der Implementierung der Viterbi-Transf ormation 
ein Gesamtleistungsverbrauch von 461,08 pW/Hz zugeordnet wer- 
den und dieser so erhaltene Wert verglichen werden mit 
Werten, die bei anderen Algorithmen und/oder Konf igurationen 
erhalten werden und/oder durch dedizierte Schaltkreise wie 
ASICs zu erhalten sind. 
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Es sei nun erwahnt, daU die Auswahl einer aus einer Vielzahl 
von Konf igurationen, auch dann sinnvoll sein kann, wenn das 
Datenverarbeitungslogikzellen- und/oder, hier gleichbedeu- 
tend, Mischfeld aus analogen und/oder digitalen Zellen (wie 
5 beschrieben) an eine insbesondere sequentielle CPU angekop- 
pelt ist. 

Ein Problem bei herkommlichen Ansatzen zu rekonf igurierbaren 
Technologien besteht dann aber oft ^ wenn die Datenverarbei- 
10 tung primar auf einer sequenziellen CPU unter Hinzuziehung 
eines konf igurierbaren Datenverarbeitungslogikzellenf eldes 
Oder dergleichen erfolgen soil und/oder eine Datenverarbei- 
tung gewunscht ist, in der viele und/oder umf angreiche 
sequenziell auszuf iihrende Verarbeitungsschfitte vorliegen. 



Es sind Ansatze bekannt, die sich damit befassen, wie eine 
Datenverarbeitung sowohl auf einem konf igurierbaren Datenver- 
arbeitungslogikzellenf eld als auch auf einer CPU erfolgen 
kann . 



So ist aus der WO 00/4 94 96 ein Verfahren zum Ausfiihren eines 
Computerprogrammes mlt einem Prozessor bekannt, der eine kon 
figurierbare funktionelle Einheit umfasst, die in der Lage 
ist, rekonf igurierbare Anweisungen auszuf uhr<en, deren Effekt 

25 zur Laufzeit durch Laden eines Konf igurationsprogrammes rede 
finiert werdeii kann, wobei das Verfahren die Schritte 
umfasst, dafi Kombinationen rekonf igurierbarer Anweisungen 
ausgewahlt, ein respektives Konf igurationsprogramm fur jede 
Kombination erzeugt und das Compute rprogramm ausgef ilhrt . wird 

30 Dabei soil jedes Mai, wenn eine Anweisung aus einer der Kom- 
binationen wahrend der Ausftihrung gebraucht wird und die 
konf igurierbare funktionelle Einheit nicht mit dem Konfigura 
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tionsprograitim fiir diese Kombination konf iguriert ist^ das 
Konf igurationsprogramm fiir alle der Anweisungen der Kombina- 
tion in die konf igurierbare funktionelle Einheit geladen 
werden. Waiter ist aus der WO 02/50665 Al eine Datenverarbei- 
5 tungsvorrichtung mit einer konf igurierbaren funktionellen 

Einheit bekannt^ wobei die konf igurierbare funktionelle Ein- 
heit dazu dient, eine Anweisung gemaB einer konf igurierbaren 
Funktion auszufiihren. Die konf igurierbare funktionelle Ein- 
heit weist eine Vielzahl von unabhangigen konf igurierbaren 
" 10 Logikblocken zum Ausfiihren programmierbarer Logikoperationen 
auf, urn die konf igurierbare Funktion zu implement ier en . Kon- 
figurierbare Verbindungsschaltkreise sind zwischen den 
konf igurierbaren Logikblocken und sowohl den Eingangen als 
auch den Ausgangen der konf igurierbaren funktionellen Einheit 
15 vorgesehen. Dies erlaubt eine Optimalisierung der Verteilung 
von Logikfunktionen uber die konf igurierbaren Logikblocke. 

Ein Problem bei herkommli.chen Architekturen besteht auch 
dann, wenn eine Ankopplung erf dlgen soli und/oder Technologi- 

20 en wie Datastreaming, Hyperthreading, Multithreading und so 

welter in sinnvoller und Performance steigernder Weise ausge- 
nutzt werden sollen. Die beispielhaft erwShnte Technologie 
der vorzitierten Nicht-Anmelder-Dokumente zeigt etwa eine An- 
ordnung, bei der zwar Konf igurationen in ein konf igurierbares 

25 Datenverarbeitungslogikzellenf eld geladen werden konnen, bei 
welchen allerdings der Datenaustausch zwischen der ALU der 
CPU und dem konf igurierbaren Datenverarbeitungslogikzellen- 
feld, sei es ein FPGA, DSP oder dergleichen, uber die 
Register erfolgt. Mit anderen Worten miissen Daten aus einem 

30 Datenstrom zunachst sequenziell in Register geschrieben wer- 
den und dann sequenziell wieder in diesen abgelegt werden. 
Auch ist ein Problem dann gegeben^ wenn ein Zugriff auf Daten 



- 65 - 



Akte: PACT33/Pi 



@ 



von extern erfolgen soli, da selbst dann noch Probleme beim 
zeitlichen Ablauf der Datenverarbeitung im Vergleich zur ALU 
und bei der Zuweisung von Konf igurationen und so welter be- 
stehen. Die herkommlichen Anordnungen, wie sie aus den Nicht- 
5 Anmelder-eigenen Schutzrechten bekannt sind, werden unter an- 
derem dazu verwendet, Funktionen iiti konf Igurlerbaren 
Datenverarbeitungslogikzellenf eld, DFP, FPGA Oder dergleichen 
abzuarbeiten, die nicht effizient auf der CPU-eigenen ALU ab- 
zuarbeiten sind. Damit wird das konf igurierbare 
10 Datenverarbeitungslogikzellenf eld . praktisch verwendet, urn be- 
nutzerdef inierte Opcodes zu ermoglichen, die eine 
effizientere Abarbeitung von Algorithitien ermoglichen, als 
dies auf dem ALU-Rechenwerk der CPU ohne konf igurierbare Da- 
tenverarbeitungslogikzellenf eldunterstiitzung moglich ware. 

15 

Im Stand der Technik ist, wie erkannt wurde, die Ankopplung 
derrmach im Regelfall wortbasiert, nicht jedoch blockbasiert , 
wie es zur datenstromenden Verarbeitung erforderlich ware. Es 
ist zunachst wunschenswert , eine effizientere Datenverarbei- 
20 tung zu ermoglichen, als dies mit einer engen Ankopplung uber 
Register der Fall ist. 

Eine weitere Moglichkeit zur Verwendung von Logikzellenf el- 
dern aus grob- und/oder f eingranular gebauten Logikzellen und 

25 Logikzellenelementen besteht in einer sehr losen Ankopplung 
eines solchen Feldes an eine herkommliche CPU und/oder ein 
CPU-Kern bei eingebetteten Systemen. Hierbei kann ein her- 
kommliches, sequenzielles Programm auf einer CPU oder 
dergleichen laufen, beispielsweise ein in C, C++ oder der- 

30 gleichen geschriebenes Programm, wobei von diesem Aufrufe 

einer Datenstromverarbeitung auf dem fein- und/oder grobgra- 
nularen Datenverarbeitungslogikzellenf eld instant iiert 
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werden. Problematisch ist dann, dass beim Programmieren fur 
dieses Logikzellenf eld ein nicht in C oder einer anderen se- 
quenziellen Hochsprache geschriebenes Programm fur die 
Datenstromabarbeitung vorgesehen werden muss. Erwunscht ware 
5 hier, dass sowohl auf der herkommlichen CPU-Architektur als 
auch auf einem mit diesen geitieinsam betriebenen Datenverar- 
beitungslogikzellenf eld C-Programme oder dergleichen 
abzuarbeiten sind, das heifit, dass insbesondere mit dem Da- 
tenverarbeitungslogikzellenf eld in quasi sequenzieller 

10 Programmabarbeitung dennoch eine Datenstromf ahigkeit erhalten 
bleibt, wahrend simultan auch insbesondere itioglich bleibt, 
dass ein CPU-Betrieb in nicht zu loser Ankopplung moglich 
ist. Es ist auch bereits bekannt, innerhalb einer Datenverar- 
beitungslogikzellenf eldanordnung^ wie sie insbesondere aus 

15 PACT02 (DE 196 51 075.9-53, WO 98/26356), PACT04 (DE 196 54 
846.2-53, WO 98/29952), PACT08, (DE 197 04 728.9, WO 
98/35299) PACT13 (DE 199 26 538.0, WO 00/77652) PACT31 (DE 
102 12 621, 6-53, PCT/EP 02/105.72) bekannt ist, auch eine se- 
quenzielle Datenverarbeitung innerhalb des 

20 Datenverarbeitungslogikzellenf eldes vorzusehen. Hierbei wird 
dann allerdingis innerhalb einer einzelnen Konf iguration, bei- 
spielsweise urn Ressourcen zu sparen, eine Zeitoptimierung zu 
erzielen und so weiter, eine partielle Abarbeitung erzielt, 
ohne dass diese bereits dazu fiihrt, dass ein Prograinmierer 

25 ein Stiick Hochsprachencode automatisch leicht ohne weiteres 
auf ein Datenverarbeitungslogikzellenf eld umsetzen kann, wie 
dies bei herkommlichen Maschinenmodellen ftir sequenzielle 
Prozessoren der Fall ist. Die Umsetzung von Hochsprachencode 
auf Datenverarbeitungslogikzellenf elder nach Prinzipien der 

30 Modelle fiir sequenziell arbeitende Maschinen ist weiterhin 
schwierig. 
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Aus dem Stand der Technik ist waiter bekannt, dass mehrere 
Konf igurationen, die eine jeweils unterschiedliche Funktions- 
weise von Arrayteilen bewirken, simultan auf dem 
Prozessorf eld (PA) abgearbeitet werden konnen und dass ein 
5 Wechsel von einer oder einigen der Konf iguration (en) ohne 

Storung anderer zur Laufzeit erfolgen kann. Es sind Verfahren 
und in Hardware implementierte Mittel zu deren Umsetzung be- 
kannt, wie sichergestellt werden kann, dass dabei ein 
Abarbeiten von auf das Feld zu ladenden Teilkonf igurationen 

10 ohne Deadlock erfolgen kann. Verwiesen wird hierzu insbeson- 
dere auf die die Filmo-Technik betreffenden Anmeldungen 
PACT05 (DE 196 54 593.5-53, WO 98/31102) PACTIO (DE 1.98 07 
872.2, WO 99/44147, WO 99/44120) PACT13 (DE 199 26 538.0, WO 
00/7-7652), PACT17 (DE 100 28 397.7, WO 02/13000). Diese Tech- 

15 nologie ermoglicht in gewisser Weise bereits eine 

Parallelisierung und, bei entsprechender Gestaltung und Zu- 
ordnung der Konf igurationen, auch eine Art 

Multitasking/Multithreading und zwar dergestalt, dass eine 
Planung, das heifit ein Scheduling und/oder eine Zeitnut zungs- 

20 planungssteuerung vorgesehen ist. Es sind also aus dem Stand 
der Technik schon Zeitnutzungsplanungssteuerungsmittel und - 
verfahren per se bekannt, die, ziimindest unter entsprechender 
Zuordnung von Konf igurationen zu einzelnen Aufgaben und/oder 
Faden zu Konf igurationen und/oder Konf igurationsf olgeri, ein 

25 Multitasking und/oder Multithreading erlauben. Die Verwendung 
solcher Zeitnut zungsplanungssteuermittel, die im Stand der 
technik zur Konf igurierung und/oder Konf igurationsverwaltung 
verwendet wurden, zu Zwecken des Scheduling von Tasks, 
Threads, Multi- und Hyperthreads wird per se als erf inderisch 

30 angesehen. 
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Wiinschenswert ist auch zumindest gemafi einem Teilaspekt in 
bevorzugten Varianten, moderne Technologien der Datenverar- 
beitung und Prograitunabarbeitung wie Multitasking, 
Multithreading, Hyperthreading unterstiitzen zu konnen, zumin- 
5 dest in bevorzugten Varianten einer Halbleiterarchitektur . 

Ein weiterer wesentlicher Aspekt der vorliegenden Erfindung 
ist somit darin zu sehen, dass dem Datenverarbeitungslo- 
gikzellenf eld Daten im Ansprechen auf die Ausfiihrung einer 
10 Ladekonf iguration durch das Datenverarbeitungslogikzellenf eld 
zugefiihrt werden und/oder Daten aus diesem Datenverarbei- 
tungslogikzellenf eld weggeschrieben (STORE) werden, indem 
eine STORE-Konf iguration entsprechend abgearbeitet wird. Die- 
se Lade- und oder Speicherkonf igurationen sind dabei 
15 . bevorzugt derart auszugestalten, dass innerhalb des. Datenver- 
arbeitungslogikzellenf eldes und/oder einer anderen Einheit 
wie einer RlSC-Architektur direkt oder indirekt Adressen je- 
ner Speicherstellen generiert werden, auf welche ladend 
und/oder speichernd direkt oder indirekt zugegriffen werden 
20 soil. Es ist durch diese Einkonf iguration von Adressgenerato- 
ren innerhalb einer Konf iguration moglich, eine Vielzahl von 
. Daten in das Datenverarbeitungslogikzellenf eld einzuladen, wo 
^ sie gegebenenf alls in internen Speichern (iRAM) ablegbar sind 

und/oder wo sie in internen Zellen wie EALUs mit Registern 
25 und/bder dergleichen elgenen Speicheritiitteln abgelegt werden 
konnen. Die Lade- beziehungsweise Speicherkonf iguration er- 
moglicht somit ein blockweises und nahezu datenstromartiges, 
insbesondere gegeniiber Einzelzugrif f vergleichsweises schnel- 
les Laden von Daten und es kann eine solche Lade-Konf igura- 
30 tion ausgefuhrt werden vor einer oder mehreren tatsachlich 

Daten auswertend und/oder verandernd abarbeitenden Konfigura- 
tion(en), mit welcher/n die vorab geladenen Daten verarbeitet 
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werden. Das Datenladen kann dabei typisch bei grofien Logik- 
zellenf eldern in kleinen Teilbereichen derselben geschehen, 
wahrend andere Teilbereiche mit anderen Aufgaben befalit sind. 
Bei der in anderen verof f entlichten Dokumenten des Anmelders 
5 beschriebenen Ping-Pong-artigen Datenverarbeitung, bei der 

auf beiden Seiten eines Datenverarbeitungsf aides Speicherzel- 
len vorgesehen sind, wobei die Daten in einem ersten 
Verarbeitungsschritt von dem Speicher auf der einen Seite 
durch das Datenverarbeitungsf eld zum Speicher auf der anderen 

10 Seite stromen, dort die beim ersten Felddurchstromen erhalte- 
nen Zwischenergebnisse im zweiten Speicher abgelegt werden^ 
gegebenenf alls das Feld umkonf iguriert wird, die Zwischener- 
gebnisse dann fur die Weiterverarbeitung zuriickstromen usw., 
kann etwa eine Speicherseite durch eine LOAD-Konf iguration in 

15 einem Array-Teil mit neuen Daten vorgeladen werden, wahrend 
aus der gegenuberliegenden Speicherseite Daten mit einer 
STORE-Konf iguration in einem anderen Array-Teil weggeschrie- 
ben werden. Dieses simultane LOAD/STORE-Vorgehen ist im 
ubrigen auch ohne raumliche Speicherbereichstrennung moglich. 

20 

Das Laden kann insbesondere aus einem Cache und in diesen 
. hinein exfolgen. Dies hat die Vorteile, dass die externa Kom- 
munikation mit groBeren Speicherbanken iiber den 
Cachecontrbller gehandhabt wird, ohne dass innerhalb des Da- 

25 teriverarbeitungslogikzellenf eldes separate Schaltanordnungen 
dafiir vorgesehen sein miissen, dass der Zugriff in lesender 
Oder schreibender Weise bei. Cache-Speichermitteln typisch. 
sehr scrinell und mit allenfalls geringer Latenzzeit erfolgen 
wird und dass auch typisch eine CPU-Einheit, dort typisch 

30 uber eine separate LOAD/STORE-Einheit , an diesen Cache ange- 
bunden ist^ sodass ein Zugriff auf Daten und ein Austausch 
derselben zwischen CPU-Kern und Datenverarbeitungslogikzel- 
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lenfeld blockweise schnell und derart erfolgen kann, dass 
nicht fiir jedes Ubergeben von Daten ein separater Befehl etwa 
aus dem OpCode-Fetcher der CPU abgeholt und verarbeitet war- 
den muss. 

5 

Es erweist sich diese Cacheankoppelung auch als wesentlich 
gunstiger als eine Ankopplung eines Datenverarbeitungslo- 
gikzellenf eldes an die ALU liber Register, wenn diese Register 
nur uber eine LOAD/STORE-Einheit mit einem Cache kommunizie- 
*- 10 ren, wie dies aus den Nicht-PACT-eigenen zitierten Schriften 
per se bekannt ist. 

® 

Es kann eine weitere Datenverbindung zu. der Lade/Speicher- 
einheit der oder einer dem Datenverarbeitungslogikzellenf eld 
15 zugeordneten Sequenziell-CPU-Einheit vorgesehen sein und/oder 
zu deren Register. 

Es sei erwahnt, dass ein Ansprechen derartiger Einheiten uber 
separate Eingangs-/Ausgangsanschlusse ( lO-Ports ) der insbe- 
20 sondere als VPU beziehungsweise XPP ausgestaltbaren 

Datenverarbeitungslogikzellenanordnung erfolgen kann und/oder 
durch einen oder mehrere einem Einzelport nachgeschaltete 
^ Multiplexer. 

25 Dass neben dem insbesondere blockweisen und/oder streamenden 
und/oder iitl Random-Access, insbesondere im RMW-Modus (Read- 
Modif y-Write-Mbdus) erfdlgenden Zugriff auf Cache-Bereiche in 
schreibender und/oder lesender Weise und/oder die LOAD/STORE- 
Einheit und/oder die (per se im Stand der Technik bekannte) 

30 Verbindung mit dem Register der Sequenziell-CPU auch eine 

Verbindung mit einem externen Massenspeicher wie einem RAM, 
einer Festplatte und/oder einem anderen Datenaustauschport 
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wie einer Antenne und so weiter erfolgen kann, sei auch er- 
wahnt- Es kann fur diesen Zugriff auf Cache- und/oder LOAD/ 
STORE-Einheit- und/oder registereinheitverschiedene Speicher- 
mittel ein separater Port vorgesehen sein. Dass hier 
5 geeignete Treiber, Signalauf bereiter fiir Pegelanpassung und 
so weiter vorgesehen sein konnen, sei erwahnt. Im Ubrigen sei 
erwahnt, dass insbesondere, jedoch nicht ausschlieBlich zur 
Aufbereitung eines in das Datenverarbeitungslogikzellenf eld 
hineinstromenden oder in diesem stromenden Datenstrom die Lo- 
10 gikzellen des Feldes ALUs bzw. EALUs umfassen konnen und 

typisch werden^ denen eingangs- und/oder ausgangsseitig, ins- 
besondere sowohl eingangs- als auch ausgangsseitig kurze,. 
feingranular konf igurierbare, FPGA-artige Schaltkreise vorge- 
setzt sein konnen, um etwa aus einem kontinuierlichen 
15 Datenstrom Vierbitblocke herauszuschneiden, wie dies fur die 
MPEG-4-Dekodierung erforderlich ist. Es ist dies zum einen 
vorteilhaft, wenn ein Datenstrom in die Zelle hineingelangen 
soli und dort ohne Blockierung von grolieren PAE-Einheiten ei- 
ner Art Vorverarbeitung zu unterwerfen ist. Dies ist auch 
20 dann von ganz besonderem Vorteil, wenn die ALU als SIMD- 

Rechenwerk ausgestaltet wird, wobei dann ein sehr breites Da- 
teneingangswort von zum Beispiel 32 Bit Datenbreite uber die 
'•SP vorgeschalteten zB FPGA-artigen Streifen aufgespalten wird in 

mehrere parallele Datenworter von zum Beispiel 4 Bit Breite, 
25 die dann in den SIMD-Rechenwerken parallel abgearbeitet wer- 
den konnen, was die Gesamtperf ormance des Systems signifikant 
zu erhohen vermag, sofern entsprechende Anwendung benotigt 
werden, Es sei darauf hingewiesen, dass vorstehend von FPGA- 
artigen vor- beziehungsweise nachges.chalteten Strukturen die 
30 Rede war. Mit FPGA-artig muss aber, was explizit erwahnt sei, 
nicht zwingend Bezug genommen sein auf 1-Bit-granulare Anord- 
nungen. Es ist insbesondere moglich, statt dieser 
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hyperf eingranularen Strukturen lediglich feiner granulare 



10 
15 
20 
25 



Strukturen von zum Beispiel 4 Bit Breite vorzusehen. Das 
heiiit, die FPGA-artigen Eingangs- und/oder Ausgangsstrukturen 
vor und/oder nach einer insbesondere als SIMD-Rechenwerk aus- 
gestalteten ALU-Einheit sind so konf igurierbar , dass immer 4 
Bit breite Datenworter zugefuhrt und/oder verarbeitet werden. 
Es ist moglich, hier eine Kaskadierung vorzusehen, so dass 
zum Beispiel die einkommenden 32 Bit breiten Datenworter in 4 
separierte bzw. separierende 8-Bit-FPGA-artige, nebeneinander 
angeordnete. Strukturen stromen, diesen 4 Stuck 8 Bit breiten 
FPGA-artigen Strukturen ein zweiter Streifen mit 8 Stuck 4 
Bit breiten FPGA-artigen Strukturen nachgesetzt ist, und ge- 
gebenenfalls nach einem weiteren derartigen Streifen dann, 
sofern dies fiir den jeweiligen Zweck als erforderlich erach- 
tet wiird, zum Beispiel 16 Stuck parallel nebeneinander 
angeordnete 2 Bit breite FPGA-artige Strukturen vorgesehen 
werden. Wenn dies der Fall ist, kann gegeniiber rein hyper- 
feingranular FPGA-artigen Strukturen eine betrachtliche 
Verringerung des Konf igurationsauf wandes erzielt werden. Dass 
dies uberdies dazu fuhrt, dass der Konf igurationsspeicher und 
so weiter der FPGA-artigen Struktur wesentlich kleiner aus- 
fallen kanri und somit eine. Einsparung an Chipflache erzielt 
wird, sei erwahnt. 

Prinzipiell sind diei vorstehend beschriebenen Kopplungsvqr- 
teile bei Datenblockstromen liber den Cache prinzipiell 
erreichbar.; besonders bevorzugt ist es jedoch, wenn der Cache 
streif enweise (slice-artig) aufgebaut ist und dann ein Zu- 
griff auf mehrere der Slices simultan erfolgen kann, 
insbesondere auf alle Slices gleichzeitig . Dies ist dann vor- 
teilhaft, wenn, was noch erortert werden wird, auf dem 
Datenverarbeitungslogikzellenfeld (XPiP) und/oder der Sequen- 



- 73 - 



Akte: PACT33/PCT 



ziell-CPU und/oder den Sequenziell-CPUs eine Vielzahl von 
Threads abzuarbeiten sind, sei es im Wege des Hyperthrea- 
dings, des Multitaskings und/oder des Multithreadings. Es 
sind also bevorzugt Cachespeichermittel mit Scheibenzugrif f 
5 bzw. Scheibenzugrif fsermoglichungs steuermitte In vorgesehen . 
Es kann dabei z. B. jedem Thread eine eigene Scheibe zugeord- 
net werden. Dies ermoglicht es spater^ beim Abarbeiten der 
Threads sicherzustellen, dass jeweils auf die entsprechenden 
Cachebereiche bei Wiederauf nahme der mit dem Thread abzuar- 
10 beitenden Bef ehlsgruppe zugegriffen wird. 

Es sei noch einmal erwahnt, dass der Cache nicht zwingend in 
Slices unterteilt sein muss, und dass, wenn dies der Fall 
ist, nicht zwingend jeder Slice einem eigenen Thread zugewie- 

15 sen werden muss. Es sei allerdings darauf hingewiesen, dass 
dies die bei weitem bevorzugte . Methode ist. Es sei welter 
darauf hingewiesen, dass es Falle geben kann, in denen nicht 
alle Cache-Bereiche simultan oder zu einer gegebenen Zeit 
temporar beniitzt werden. Vielmehr ist zu erwarten, dass bei 

20 typischen Datenverarbeitungsanwendungen, wie sie in handge- 

haltenen mobilen Telefonen (Handys) , Laptops, Kameras und so 
welter auf treten werden, hauf.ig Zeiten vorliegen werden, in 
denen nicht der gesamte Cache benotigt wird. Es ist daher be- 
soriders bevorzugt, wenn einzelne Cache-Bereiche von der 

25 Leistungsversorgung derart trennbar sind, dass ihr Energie- 
verbrauch signifikant absinkt> insbesondere auf oder nahe 
null. Dies kann bei sliceweiser Ausgestaltung des Caches 
durch sliceweise Abschaltung derselben uber geeignete Lei- 
stungsabtrennmittel geschehen. Die Abtrennung kann entweder 

30 liber eine Heruntertaktung, Taktabtrennung oder eine Lei- 
stungsabtrennung erfolgen. Es kann insbesondere einer 
einzelnen Cache-Scheibe oder dergleichen eine Zugrif f serken- 
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nung zugeordnet sein^ welche dazu ausgebildet ist, zu erken- 
nen, ob ein jeweiliger Cache-Bereich beziehungsweise eine 
j eweilige Cache -Scheibe moment an einen ihm zugeordnet en 
Thread, Hyperthread oder Task hat, von welchem er benutzt 
5 wird. Sofern dann vom Zugrif f serkennungsmittel festgestellt 
wird, dass dies nicht der Fall ist, wird typisch eine Abtren- 
nung vom Takt und/oder sogar der Leistung moglich sein. Es 
. sei erwahnt, dass bei Wiedereinschalten der Leistung nach ei- 
nem Abtrennen ein sofortiges Wiederansprechen des 
10 Cachebereiches moglich ist, also keine signifikante Verzoge- 
rung durch das An- und Ausschalten der Leistungszuf uhr zu 
erwarten ist, sofern mit gangigen geeigneten Halbleitertech- 
nologien eine Implementierung in Hardware erfolgt. 

15 Ein weiterer besonderer Vorteil, der sich bei der vorliegen- 
den Erfindung ergibt, besteht darin, dass zwar eine besonders 
effiziente Kopplung bezuglich des Ubertrags von Daten bezie- 
hungsweise Operanden in insbesondere blockweiser Form gegeben 
ist, dass aber dennoch ein Balancing nicht in der Weise er- 

20 forderlich ist, dass die exakt gleiche Verarbeitungszeit in 

Sequenziell-CPU und XPP beziehungsweise Datenverarbeitungslo- 
gikzellenf eld erforderlich ist. Vielmehr erfolgt, die 
Verarbeitung in einer praktisch oftmals unabhangigen Weise, 
insbesondere derart, dass. die Seguenziell-CPU und die Daten^ 

25 verarbeitungsloglkzellenf eldanordnung fur einen Scheduler 
. Oder dergleichen als separate Ressourcen betrachtbar sind. 
Dies erlaubt eine sofortige Umsetzung bekannter Datenverar- 
beitungsprogrammauf spaltungstechnologien wie Multitasking, 
Multithreading und Hyperthreading . Der. sich ergebende Vor- 

30 teil, dass ein Pf adbalancing nicht erforderlich ist, fuhrt 
dazu, dass beispielsweise in der Sequenziell-CPU beliebige 
Anzahlen von Pipelinestuf en durchlaufen werden konnen, Tak- 
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tungen in unterschiedlicher Weise mogliche sind und so wel- 
ter. Ein weiterer Vorteil der vorliegenden Erfindung besteht 
darin, dass durch das Hineinkonf igurieren einer Ladekonfigu- 
ration beziehungsweise einer Storekonf iguration in das XPP 
5 Oder andere Datenverarbeitungslogikzellenf elder die Daten in 
das Feld mit einer Geschwindlgkeit hineingeladen werden oder 
aus diesem herausgeschrieben werden konnen, die nicht mehr 
bestimmt ist durch die Taktgeschwindigkeit der CPU^ die Ge- 
schwindlgkeit, mit welcher der OpCode-Fetcher arbeitet, oder 
10 dergleichen. Mit anderen Worten ist die Ablauf steuerung der 
Sequenziell-CPU nicht mehr f laschenhalsartig begrenzend fiir 
den Datendurchsatz des Datenzellenlogikf eldes, ohne dass eine 
nur noch lose Ankopplung besteht. 

15 Wahrend es in einer besonders bevorzugten Variante der Erfin- 
dung moglich ist, die fiir eine XPP-Einheit bekannte CT (bzw. 
CM; Konf igurationsmanager bzw. Konf igurationstabelle) zu ver- 
wenden, urn sowohl das Konf igurieren eines oder mehrerer, auch 
hierarchisch mit mehreren CTs angeordneter XPP-Felder und 

20 gleichzeitig eines oder mehrerer Sequenziell-CPUs, dort quasi 
als Hyperthreading-Hardwareverwaltung /Scheduler zu verwen- 
den, was den inharenten Vorteil hat, daI3 bekannte 
Technologien wie FILMO usw. fiir die hardwareunterstutzte Ver-. 
waltung beim Hyperthreading einsetzbar. werden, ist es 

25 alternativ und/oder, insbesondere in hierarchischer Anord- 
nung, zusatzlich moglich, dass ein 
. Datenverarbeitungslogikzellenf eld wie eine XPP Konf iguratio- 
nen vom OpCode-Fetcher einer Sequenziell-CPU uber das 
Koprozessor-Interf ace erhalt. Dies fiihrt dazu, dali von der 

30 Sequenziell-CPU und/oder einer anderen XPP ein Aufruf instan- 
tiiert werden kann, der zu einer Datenabarbeitung auf der XPP 
fuhrt. Die XPP wird dabei dann z. B. iiber die beschriebene 
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Cache-Ankopplung und/oder mittels LOAD- und/oder STORE- 
Konf igurationen^ die Adressgeneratoren ftir Laden und/oder 
Wegschreiben von Daten im XPP- bzw. Datenverarbeitungslo- 
gikzellenf eld vorsehen, im Datenaustausch gehalten. Mit 
5 anderen Worten wird eine Koprozessor-artige Ankopplung eines 
Datenverarbeitungslogikzellenf eldes moglich, wahrend gleich- 
zeitig ein datenstromartiges Datenladen durch Cache- und/oder 
I/O-Port-Kopplung erfolgt. 

10 Es sei erwahnt, dali die Koprozessor-Ankopplung, d. h. die An- 
kopplung des Datenverarbeitungslogikzellenf eldes typisch dazu 
fuhren wird, daB das Scheduling auch fiir dieses Logikzellen- 
feld auf der Sequenziell-CPU oder einer dieser tibergeordneten 
Schedulereinheit bzw. einem entsprechenden Schedulermittel 

15 erfolgen wird. In einem solchen Fall findet praktisch die 
Threading-Kontrolle und -verwaltung auf dem Scheduler bzw. 
der Sequenziell-CPU statt. Obwohl dies per se moglich ist, 
wird dies, zumindest bei einfachster Implementierung der Er- 
findung, nicht zwingend der Fall sein. Vielmehr kann eine 

20 Verwendung des Datenverarbeitungslogikzellenf eldes durch Auf- 
ruf in herkommlicher Weise wie bei einem Standard-Koprozessor 
etwa bei 8086/8087-Koinbinationen .erf olgen. 

Welter sei erwahnt, daB es in einer besonders beyorzugten Va- 
25 riante, unabh^ngig von der Art der Konf iguration, sei es iiber 
das Koprozessor-Interf ace, den als Scheduler mitdienenden 
Konf igurationsmanager (CT) der XPP bzw. des Datenverarbei- 
. tungslogikzellenf eldes oder dergleichen oder auf andere 
Weise, moglich ist, im bzw. unmittelbar am Datenverarbei- 
30 tungslogikzellenf eld bzw. unter Verwaltung des 

Datenverarbeitungslogikzellenf eldes Speicher , insbesondere 
interne Speicher, insbesondere bei der XPP-Architektur, wie 
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sie aus den diversen Voranineldungen und den Verof f entlichun- 
gen des Anmelders bekannt ist, RAM-PAEs, Oder andere 
entsprechend verwaltete oder interne Speicher wie ein Vektor- 
register anzusprechen, d. h. die uber die LOAD-Konf iguration 
5 eingeladenen Datenmengen vektorartig wie in Vektorregistern 
in die internen Speicher abzulegen, dann, nach Umkonf igurie- 
ren der XPP bzw. des Datenverarbeitungslogikzellenfeldes, 
also Oberschreiben bzw. Nachladen und/oder Aktivieren einer 
neuen Konf iguration, die die eigentliche Verarbeitung der Da- 

10 ten durchfiihrt (in diesem Zusammenhang sei daraiif 

hingewiesen, dafi fur eine solche Verarbeitungskonf iguration 
auch Bezug genoiranen werden kann auf eine Mehrzahl von Konfi- 
gurationen, die z. B. im Wave-Modus und/oder sequenziell 
nacheinander abzuarbeiten sind) zuzugreifen wie bei einem 

15 Vektorregister und dann die dabei erhaltenen Eirgebnisse 

und/oder Zwischenergebnisse wiederum in die internen oder 
liber die XPP wie interne Speicher verwalteten externen Spei- 
cher, um dort diese Ergebnisse abzulegen. Die so 
vektorregisterartig mit Verarbeitungsergebnissen beschriebe- 

20 nen Speichermittel unter XPP-Zugrif f sind dann, nach 

Rekonf igurieren der Verarbeitungskonf iguration durch Laden 
der STORE-Konf iguration in geeigneter Weise weggeschrieben, 
was wiederum datenstromartig geschieht, sei es.iiber den I/O- 
Port direkt in externe Speicherbereiche und/oder, wie beson- 

25 ders bevorzugt, in Cache-Speicherbereiche, auf welche dann zu 
eineiti spSteren Zeitpunkt die Sequenziell-CPU und/oder andere . 
Konf igurationen auf der zuvor die Daten. erzeugt habenden XPP 
oder einer anderen . entsprechenden Datenverarbeitungseinheit 
zugreifen konnen. 



30 



Eine besonders bevorzugte Variante besteht darin, zumindest 
fiir bestimmte Datenverarbeitungsergebnisse. und/oder Zwischen- 
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m 



ergebnisse als Speicher- bzw. Vektorregistermittel, in wel- 
chem bzw. welches die erhaltenen Daten abzulegen sind^ nicht 
einen internen Speicher zu benutzen, in welchen Daten iiber 
eine STORE-Konf iguration in den Cache- oder einen anderen Be- 
5 reich, auf welchen die Sequenziell-CPU oder eine andere 

Datenverarbeitungseinheit zugreif en konnen, wegzuschreiben 
sind, sondern statt dessen unitiittelbar die Ergebnisse wegzu- 
schreiben in entsprechende^ insbesondere zugrif f sreservierte 
Cachebereiche^ die insbesondere Slice-artig organisiert sein 
10 konnen. Dies kann gegebenenf alls den Nachteil einer groBeren 
Latenz haben, insbesondere wenn die Wege zwischen der XPP- 
oder Datenverarbeitungslogikzellenf eldeinheit. und deiti Cache, 
so lang sind, dafi die Signallauf zeiten ins Gewicht fallen, 
fuhrt aber dazu, daii gegebenenf alls keine weitere STORE-^ 
15 Konf iguration benotigt wird. Es sei iiti iibrigen erwahnt, daB 
eine derartige Abspeicherung von Daten in Cache-Bereiche ei- 
nerseits, wie vorstehend beschrieben, dadurch moglich ist, 
dafi der Speicher^ in welchen geschrieben wird, physikalisch 
nahe beim Cache-Controller liegt und als Cache ausgestaltet 
20 ist, dass aber alternativ und/oder zusatzlich auch die Mog- 
lichkeit besteht, einen. Teil eines XPP-Speicherbereiches, 
XPP-internen Speichers oder dergleichen, insbesondere bei RAM 
iiber PAEs unter die Verwaltung eines oder, nacheinander meh- 
rerer Cache-Speichercontroller zu stellen. Dies hat dann 
25 Vorteile, wenn die Latenz beim Abspeichern der Verarbeitungs- 
ergebnisse, welche innerhalb des 

Datenverarbeitungslogikzellenf eldes bestimmt werden, gering 
gehalten werden soil, wahrend die Latenz beim Zugriff auf den 
dann nur noch als „Quasi-Cache^^ dienenden Speicherbereich 
30 durch andere Einheiten nicht oder nicht signifikant ins Ge- 
wicht fallt. 
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Es sei im ubrigen erwahnt, daB auch eine Ausgestaltung derart 
moglich ist^ daB der Cache-Controller einer herkommlichen Se- 
quenziell-CPU einen Speicherbereich als Cache anspricht, der, 
ohne dem Datenaustausch mit dem Datenverarbeitungs- 
5 logikzellenf eld zu dienen, auf und/oder bei diesem physika- 
lisch liegt. Dies hat den Vorteil, daB dann, wenn Anwendungen 
auf dem Datenverarbeitungslogikzellenf eld laufen, die einen 
allenfalls geringen lokalen Speicherbedarf haben, und/oder 
wenn auch nur wenige weitere Konf igurationen bezogen auf die 
10 zur Verfiigung stehenden Speichermengen benotigt werden, diese 
einer oder mehreren Sequenziell-CPUs als Cache zur Verfugung 
stehen konnen. Es sei erwahnt, daB dann der Cache-Controller 
fur die Verwaltung eines Cache-Bereiches mit dynamischem Um- 
fang, d. h. variierender GroBe ausgebildet sein kann und 
15 wird. Eine dynamsiche Cache-Umf angsverwaltung bzw. Cache- 

Umf angsverwaltungsmittel fiir die dynamische Cache-Verwaltung 
wird typisch die Arbeitslast auf der Sequenziell-CPU und/oder 
dem Datenverarbeitungslogikzellenf eld berucksichtigen . Mit 
anderen Worten kann beispielsweise analysiert werden, wie 
20 viele NOPs in einer gegebenen Zeiteinheit auf der Sequenzi- 
ell-CPU vorliegen und/dder wie viele Konf igurationen im XPP- 
. Feld in dafiir vorgesehenen Speicherbereichen yorabgelegt sein 
"•^^ sollen, um eine schnelle Umkonf iguration, sei es im- Wege ei- 

ner Wellenrekonf iguration oder auf andere Weise. Die hiermit 
25 offenbarte dynamische Cachegrosse ist dabei insbesondere be- 
vorzugt lauf zeitdynamisch, d. h . der Chacecontroller 
verwaltet jeweils eine aktuelle Cachegrosse, di^ sich von 
Takt zu Takt oder Taktgruppe andern kann. Es sei im ubrigen 
darauf hingewiesen, daB die Zugrif f sverwaltung eines XPP- 
30 bzw. Datenverarbeitungslogikzellenf eldes mit Zugriff als in- 
terner Speicher wie bei einem Vektorregister und als Cache- 
artiger Speicher fiir den externen Zugriff was die Speicherzu- 
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griffe angeht bereits beschrieben wurde in der DE 196 54 595 
und der PCT/DE 97/03013 (PACT03) . Die genannten Schriften 
sind durch Bezugnahme zu Of f enbarungszwecken hiermit vollum- 
f anglich eingegliedert . 

5 

Vorstehend wurde auf Datenverarbeitungslogikzellenf elder Be- 
zug genoinmen, die insbesondere zur Laufzeit rekonf igurierbar 
sind. Es wurde diskutiert, dass bei diesen eine Konfigurati- 
onsverwaltungseinheit (CT bzw. CM) vorgesehen werden kanri. 

10 Aus den diversen, zu Of f enbarungszwecken unter Bezug genomme- 
nen Schutzrechten des Anmelders sowie seinen weiteren 
Verof f entlichungen ist die Verwaltung von Konf igurationen per 
se bekannt. Es sei nun explizit darauf hingewiesen, dass der- 
artige Einheiten und deren Wirkungsweise, mit der 

15 insbesondere unabhangig von Ankopplungen an Sequenziell-CPUs 
etc. aktuell noch nicht benotigte Konf igurationen vorladbar 
sind^ auch sehr gut nutzbar sind, urn im Multitaskingbetrieb 
und/oder bei Hyperthreading und/oder Multithreading einen 
Task- beziehungsweise einen Thread- und/oder Hyperthreadwech- 

20 sel zu bewirken. Dazu kann ausgenutzt werden, dass wahrend 

der Laufzeit eines Threads oder Tasks in die Konf iguratibns- 
speicher bei einer einzelnen oder einer Gruppe von Zellen des 
Datenverarbeitungslogikzellenf eldes, also beispielsweise ei- 
ner PAE eines PAE-Feldes (PA) auch Konf igurationen fiir 

25 unterschiedliche Aufgaben,. das heilit Tasks oder Threads be- 
ziehungsweise Hyperthreads geladen werden konnen. Dies fuhrt 
dann dazu, dass bei einer Blockade eines Tasks oder Threads, 
etwa wenn auf Daten gewartet werden muss, well diese noch 
nicht verfugbar sind, sei es, da sie von einer anderen Ein- 

30 heit noch nicht generiert oder empfangen wurden, 

beispielsweise auf Grund von Latenzen, sei es, well eine Res- 
source derzeit noch durch einen anderen Zugriff blockiert 
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ist, dann Konf igurationen fiir einen anderen Task oder Thread 
vorladbar und/oder vorgeladen sind und auf diese gewechselt 
warden kann, ohne dass der Zeitoverhead fur einen Konfigura- 
tionswechsel bei der insbesondere schattengeladenen 
5 ' Konf iguration abgewartet warden muss. Wahrand as prinzipiall 
moglich ist, diese Technik auch dann zu verwenden, wenn in- 
nerhalb eines Tasks die wahrscheinlichste Weiterf lihrung 
vorhergesagt wird und eine Vorhersage nicht zutrifft (predic- 
tion miss), wird diese Art des Betriebs bei vorhersagef reiem 

10 Betrieb bevorzugt sein. Bei Verwendung mit einer rein sequen- 
tiellen CPU und/oder mehreren rein sequentiellen CPUs wird 
somit durch die Zuschaltung eines Konf igurationsmanagers eine 
Hyperthreadingverwaltungshardware realisiert. Verwiesen s.ei 
hinsichtlich dessen insbesondere auf PACTIO . (DE 1.98 07 872.2, 

15 WO 99/44147, WO 99/44120) . Dabei kann es als ausreichend er- 
achtet werden, insbesondere dann, wenn nur fiir eine CPU 
und/oder einige wanige Saquanziall-CPUs eine Hyperthraading- 
verwaltung gewlinscht ist, auf bestimmte, in den speziell 
unter Bezug genommenen Schutzrechten beschriebene Teilschal- 

20 tungen wie den FILMO zu verzichten. Insbesondere wird damit 
die Verwendung der dort beschriebenen Konf igurationsmanager 
mit und/oder ohne, FILMO fiir die Hyperthreadingverwaltung fur 
eine und/oder mehrere rein sequenziell arbeitende CPUs mit 
Oder ohne Ankopplung an eine XPP oder ein anderes Datenverar- 

25 beitungslogikzellenf eld offenbart und hiermit fiir sich 

beansprucht. Es wird hierin eine fiir sich erf inderische Be- 
sonderheit gesehen. Es sei im Ubrigen erwahnt, dass eine 
Vielzahl von CPUs realisiert werden kann itiit den bekannten 
Techniken, wie sie insbesondere aus PACT31 (DE 102 12 621.6- 

30 53, PCT/EP 02/10572) bakannt sind, bei welchen innerhalb ei- 
nes Arrays eine oder mehrere Sequenziell-CPUs aufgebaut 
werden unter Ausnutzung eines oder mehrerer Speicherbereiche 
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insbesondere iiti Datenverarbeitungslogikzellenf eld fiir den 
Aufbau der sequenziellen CPU, insbesondere als Befehls- 
und/oder Datenregister . Auch sei darauf verwiesen, dass be- 
reits in fruheren Anmeldungen wie PACT02, (DE 196 51 075.9- 
5 . 53, WO 98/26356), PACT04 (DE 196 54 846.2-53, WO 98/29952), 
PACT08, (DE 197 04 728.9, WO 98/35299) offenbart wurde, wie 
Sequenzer mit Ring- und/oder Wahlf rei-Zugrif f-Speichern auf- 
gebaut werden konnen. 

10 Es sei darauf hingewiesen, dass ein Task- beziehungsweise 

Thread- und/oder Hyperthreadwechsel unter Verwendung der be- 
kannten CT-Technologie derart erfolgen kann und bevorzugt 
auch erfolgen wird, dass einem per se bekannten. Software- 
imp lementier ten Betriebssystem-Scheduler Oder dergleichen von 

15 der CT Perf ormance-Scheiben und/oder Zeitscheiben zugeordnet 
werden, wahrend welchen bestimmt wird, von welchen Tasks oder 
Threads nachfolgend welche Telle per se, unterstellt, dass - 
Ressourcen frei sind, abzuarbeiten sind. Dazu sei ein Bei- 
spiel wie folgt gegeben: Zunachst soil fiir einen ersten Task 

20 eine Adressfolge generiert warden, gemafi welcher wahrend der 
Ausfvihrung einer LOAD-Konf iguration Daten aus einem Cache- 
Speicher, an dem ein Datenverarbeitungslogikzellenf eld in der 
beschriebenen Weise angekoppelt ist, geladen werden sollen. 
Sobald diese Daten vorliegen, kann mit der Abarbeitung einer 

25 zweiten, der eigentlichen Datenverarbeitungskonf iguration, 

begonneri werden. Auch diese kann vorgeladen werden, da sicher 
feststeht, dass diese Konf iguration, sofern keine Interrupts 
Oder dergleichen einen vollstSndigen Taskwechsel erzwingen, 
auszufiihren ist. In herkommlichen Prozessoren ist nun das 

30 Problem des sogenannten Cache-Miss bekannt, bei dem die Daten 
zwar angefordert werden, aber nicht im Cache fur den Ladezu- 
. griff bereit liegen. Tritt ein solcher Fall in einer Kopplung 
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gemaiS der vorliegenden Erfindung auf, kann bevorzugt auf ei- 
nen anderen Thread, Hyperthread und/oder Task gewechselt 
warden, der insbesondere zuvor von dem insbesondere soft- 
wareimplementierten Betriebssystem-Scheduler und/oder einer 
5 - anderen hard- und/oder sof twareimplementierten, entsprechend 
wirkenden Einheit fur eine nachstmogliche Ausfuhrung bestiinint 
wurde und demgemaB bevorzugt vorab in einen der verfiigbaren 
Konf igurationsspeicher des Datenverarbeitungslogikzellenf el- 
des insbesondere im Hintergrund wahrend der Ausfuhrung einer 
■-10 anderen Konf iguration, beispielsweise der LOAD-Konf iguration, 
welche das Laden jener Daten, auf die nun gewartet wird, be- 
wirkt hat, geladen wurde. Das fiir die Vorab konf iguration 
ungestort von der tatsachlichen Verschaltung der insbesondere 
grobgranular ausgebildeten Datenverarbeitungslogikzellen des 

15 Datenverarbeitungslogikzellenf eldes separate Konf igurations- 
leitungen von der konf igurierenden Einheit zu den jeweiligen 
Zellen direkt und/oder uber geeignete Bussysteme gefuhrt sein 
konnen wie per se im Stand der Technik bekannt, sei hier noch 
einma.l explizit erwahnt, da diese Ausbildung hier besonders 

20- bevorzugt ist, urn ein ungestortes Vorabkonf igurieren ohne 

Storung einer anderen, gerade laufenden Konf iguration zu er- 
moglichen. Wenn dann die Konf iguration, auf welche wahrend 
beziehungsweise auf Grund des Task-Thread- und/oder Hyper- 
threadwechsels gewechselt wurde, abgearbeitet wurde, und 

25 zwar, bei bevorzugten nicht teilbaren,. ununterbrechbaren und 
somit quasi atomaren Konf igurationen bis zum Ende abgeabeitet 
wurde, wird teilweise eine. weitere andere Konf iguration wie 
vorbestimmt durch die entsprechenden Scheduler, insbesondere 
den betriebssystemartigen Scheduler festgelegt, abgearbeitet 

30 und/oder jene Konf iguration, zu welcher zuvor die zugehorige 
LOAD-Konf iguration ausgefuhrt wurde. Vor der Ausfuhrung einer 
Verarbeitungskonf iguration, zu welcher zuvor eine LOAD- 
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Konf iguration ausgefiihrt wurde, kann insbesondere abgetestet 
warden, ob mittlerweile die entsprechenden Daten in das Array 
eingestromt sind, also die Latenzzeit, wie sie typisch auf- 
tritt, verstrichen ist und/oder die Daten tatsachlich 
5 vorliegen. 

Mit anderen Worten warden dann Latenzzeiten^ wenn sie auftre- 
ten, well z. B. Konf igurationen noch nicht einkonf iguriert 
sind, Daten noch nicht geladen und/oder Daten noch nicht weg- 

10 geschrieben wurden, uberbriickt und/oder verdeckt, indem 

Threads, Hyperthreads und/oder Tasks ausgefiihrt werden, wel- 
che schon vorkonf iguriert sind und welche mit Daten arbeiten, 
die schon verfiigbar sind beziehungsweise die an Ressourcen 
weggeschrieben werden konnen, die fur das Wegschreiben be- 

15 reits zur Verfiigung stehen. Auf diese Weise werden 

Latenzzeiten weitgehend uberdeckt und es wird, eine hinrei- 
chende Anzahl von per se auszuf iihrenden Threads, Hyperthreads 
und/oder Tasks unterstellt, eine praktisch 100%^ige Ausnut- 
ziing des Datenverarbeitungslogikzellenf eldes erreicht . 

20 

Mit dem beschriebenen System beziiglich Datenstrom-Fahigkeit 
bei gleichzeitiger Ankopplung an eine Sequenziell-CPU und/ 
Oder beziiglich . der Ankopplung eines XPP-Array beziehungsweise 
Datenverarbeitungslogikzellenf eldes und simultan einer Se- 

25 quenziell-CPU an eine geeignete Schedulereinheit wie einen 

Konf igurationsmanager oder dergleichen lassen sich insbeson- 
dere ohne weiteres echtzeitf ahige Systeme realisieren. Zur 
Echtzeitf ahigkeit muss gewahrleistet sein, dass auf eintref- 
fende Daten beziehungsweise Interrupts, die insbesondere das 

30 Dateneintref f en signalisieren, innerhalb einer in keinem Fall 
zu liberschreitenden Maximalzeit reagiert werden kann. Dies 
kann beispielsweise geschehen durch einen Taskwechsel auf ei- 
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nen Interrupt hin und/oder^ beispielsweise bei priorisierten 
Interrupts, durch Festlegung, dass ein gegebener Interrupt 
momentan zu ignorieren ist, wobei auch dies innerhalb einer 
bestimmten Zeit festzulegen ist. Ein Taskwechsel bei derarti- 
5 gen echtzeitf ahigen Systemen wird typisch auf drei Arten 
erfolgen konnen, namlich entweder dann, wenn ein Task eine 
bestimmte Zeit gelauf en ist (Watch-dog-Prinzip) , bei Nicht- 
zurverf ugungstehen einer Ressource, sei es durch deren 
Blockade durch anderen Zugriff oder aufgrund von Latenzen 
10 beim Zugriff darauf , insbesondere in schreibender und/oder 
lesender Weise, das heiBt bei Latenzen von Datenzugrif f en 
und/oder beim Auftreten von Interrupts, 

Mit der vorliegenden Erfindung kann die Echtzeitf ahigkeit ei- 
15 nes Datenverarbeitungslogikzellenf eldes nunmehr errei.cht 

werden, indem eine oder mehrere von drei moglichen Varianten 
implementiert wird. 

Eine erste Variante dazu besteht darin, dass innerhalb einer 
20 von dem Scheduler beziehungsweise der CT ansprechbaren Res- 
source ein Wechsel zur Abarbeitung beispielsweise eines 
Interrupts erfolgt. Sofern die Ansprechzeiten auf Interrupts 
Oder andere Anf orderungen so groB sind, dass wahrend dieser 
Zeit eine Konf iguration ohne Unterbrechung noeh abgearbeitet 
25 werden kann^ ist dies unkritisch, zumal wahrend der Abarbei- 
tung der aktuell laufenden Konf iguration auf jener Ressource, 
die fur die Abarbeitung des Interrupts zu wechseln ist, eine 
Konf iguration zur Interruptabarbeitung vorgeladen werden 
kann. Die Auswahl der vorabzuladenden Interrupt-bearbeitenden 
30 Konf iguration ist z. B. durch die CT durchzuf uhren . Es ist 
moglich, die Laufzeit der Konf iguration auf der fiir die In- 
terruptbearbeitung f reizugebenden bzw. zu wechselnden 
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Ressource zu begrenzen. Verwiesen wird dazu auf 
PACT29/PCT(PCT/DE03/000942) . 



Bei Systemen, die schneller auf Interrupts reagieren miissen, 
5 kann es bevorzugt sein, eine einzelne Ressource, also bei- 
spielsweise eine separate XPP-Einheit und/oder Telle eines 
XPP-Feldes fiir eine solche Abarbeitung zu reservieren. Wenn 
dann ein schnell abzuarbeitender Interrupt auftritt, kann 
entweder eine fiir besonders kritische Interrupts schon vorab 

10 voirgeladene Konf iguration abgearbeitet werden oder es wird 

sofort mit dem Laden einer Interrupt behandelnden Konfigura- 
tion in die reservierte Ressource begonnen. Eine Auswahl der 
jeweils fiir den entsprechenden Interrupt erf orderlichen Kon- 
figuration ist durch entsprechende Triggerung, 

15 Waveabarbeitung usw. moglich. 

Es sei im Ubrigen erwahnt, dass es mit den schon beschriebe- 
nen Methoden ohne weiteres moglich ist, eine instantane 
Reaktion auf einen Interrupt zu erhalten, indem iiber die Ver- 

20 wendung von LOAD/STORE-Konf igurationen eine Code-Reentranz 
erreicht wird. Hierbei wird nach jeder datenbearbeitenderi 
Konf iguration bder zu gegebenen Zeiten, b.eispielsweise all.e 
fiinf Oder zehn Konf igurationen eine STORE-Konf iguration aus- 
gefuhrt und dann eine LOAD-Konf iguration unter Zugriff auf 

25 jene Speicherbereiche ausgefiihrt, in die zuvor weggeschrieben 
wurde. Wenn sichergestellt wird, dass die von der STORE- 
Konf igura-tion benutzten Speicherbereiche so lange unberiihrt 
bleiben, bis durch Fortschreiten im Task eine weitere Konfi- 
guration samtliche relevanten Inf ormationen (Zustande, Daten) 

30 weggeschrieben hat, ist sichergestellt , dass bei Wiederladen, 
also Wiedereintritt in eine zuvor bereits begonnene, aber 
• nicht zu Ende gefiihrte Konf iguration oder Konf igurationskette 
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wieder dieselben Bedingungen erhalten werden. Eine solche 
Zwischenschaltung von LOAD/STORE-Konf igurationen unter simul- 
tanem Schutz von noch nicht veralteten STORE- 
Speicherbereichen lasst sich automatisch ohne zusatzlichen 
5 Programmieraufwand sehr einfach generieren, z. B. von einem 
Compiler. Dort kann die Ressourcenreservierung gegebenenf alls 
vorteilhaft sain. Das bei der Ressourcenreservierung und/oder 
in anderen Fallen auf zumindest eine Menge hochpriorisierter 
Interrupts durch Vorabladen von bestiiranten Konf igurationen 
10 reagiert werden kann, sei noch einmal erwahnt. 

Eine weitere, besonders bevorzugte Variante der Reaktion auf 
Interrupts besteht dann, wenn zumindest eine der ansprechba- 
ren Ressourcen eine Sequenziell-CPU ist^ darin, auf dieser 

15 eine Interrupt-Routine abzuarbeiten, in welcher wiederum Code 
fur das Datenverarbeitungslogikzellenf eld verboten ist. Mit 
anderen Worten wird eine Interrupt-Routine ausschlielilich auf 
einer Sequenziell-CPU abgearbeitet , ohne dass XPP-Datenverar- 
beitungsschritte aufgerufen werden. Dies garantiert, dass der 

20 Verarbeitungsvorgang auf dem Datenverarbeitungslogikzellen- 
feld nicht zu unterbrechen ist und es kann dann eine 
Weiterabarbeitung auf diesem Datenverarbeitungslogikzellen- 
feld nach einem Taskswitch erfolgen. Obwohl damit die 
eigentliche Interrupt-Routine keinen X.PP-Code besitzt, kann 

25 dennoch dafiir gesorgt werdenv dass auf einen Interrupt hin zu 
einem spateren, nicht mehr echtzeitrelevanten Zeitpunkt mit 
der XPP auf einen durch einen Interrupt und/oder eine Echt- 
zeitanf orderung erfassten Zustand und/oder Daten unter 
Verwendung des Datenverarbeitungslogikzellenf eldes reagiert 

30 werden kann. 
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Es ist bei der Erfindung moglich, bei einem an eine CPU ange- 
koppelten Datenverarbeitungslogikzellenf eld optimierte 
Konf igurationen in das Feld zu laden, das insbesondere aus 
einem Analog/Digital-Mischf eld bestehen kann und Zellen mit 
5 f requenzoptimierten Aspektverhaltnis besitzt. Beim Laden von 
Konf igurationen kann es nun sehr vorteilhaft sein, wenn Busse 
dynamisch aufbaubar sind. Die vorliegende Erfindung offenbart 
daher zugleich ein Verfahren zuiti dynamischen Aufbau von Bus - 
sen in Feldern miteinander koiranunizierender Elemente, 
10 insbesondere rekonf igurierbarer Felder wie Prozessoren grob- 
granularer Felder, das in Verbindung mit den andere Aspekten 
besonders vorteilhaft ist, aber zugleich auch fur sich genom- 
men erf inderisch- 

15 Es ist bereits bekannt, grobgranulare Felder rekonf igurierba- 
rer Elemente vorzusehen, bei denen zwis.chen den 
rekonf igurierbaren Elementen Bussysteme verlaufen. In bekann- 
ten Anwendungen werden die Bussysteme, die die Verbindungen 
. fur die Kommunikation der einzelnen Elemente untereinander 

20 vorsehen, durch eine zentrale Einheit konf iguriert . Die Art 
und Weise, wie die Busverbindung aufgebaut werden soil, kann 
dabei im Vorfeld bestimmt werden, etwa zu einer Compilezeit. 
Denkbar ist auch eine Festlegung zur Laufzeit, bei der durch 
einen Scheduler oder dergleichen fiir verschiedene, aktuell zu 

25 ladende Konf igurationen ein Busaufbau vorgenommen wird, . bzw. 
ein Routing. Auf die Anmeldung 102 36 272.8 wird hierzu ins- 
besondere hingewiesen, da diese Anmeldung bereits zeigt, wie 
aus unterschiedlichen Konf igurationen zur Ausfiihrung ein und. 
desselben Programmes zu einer Laufzeit eine Auswahl erfolgen 

30 kann. 
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Es sind auch schon Bussysteme fur rekonf igurierbare Prozesso- 
ren bekannt, bei denen ein dynamischer Busaufbau erfolgen 
kann. Erwahnt sei, dali es insbesondere moglich ist, Bussyste- 
me zu mischen, namlich die bekannten, sogenannt ,,globalen^' 
5 dynamisch aufbaubaren Busse und nicht dynamisch aufbaubare 
Busse. Dies gilt auch fur die nachfolgend offenbarten Bussy- 
steme und -verfahren, das heiBt die beschriebenen Bussysteme 
und Verbindungsaufbauverf ahren miissen nicht die einzigen, in 
einem Feld zu verbindender Elemente vorzusehenden Bussysteme 
10 bzw. -verf ahren sein. 

Es ist auch moglich., und dies gilt auch fiir Zwecke der vor- 
liegenden Erfindung, neben grobgranularen Einheiten mit 
insbesondere f eingranularer Steuerlogik, wie f eingranularen 

15 Triggernetzwerken usw. eine sogenannte Makrogranularitat vor- 
zusehen, bei der eine Vielzahl grobgranularer Elemente mit 
herkommlichen Bussystemen usw. zusammengef asst werden und bei 
denen dann mehrere solcher zusammengef asster, grobgranularer 
Elemente, zwischen denen bereits Bussysteme in konf igurierba- 

20 rer oder fester Weise vorgesehen sein konnen, wiederum iiber 

Bussysteme kommunizierende Telle einer ubergeordneten Einheit 
bilden. Mierarchische Strukturen. fur derartige Anordnungen 
sind beispielsweise aus DE 199 26 538.0 od. PCT WO 00/77652 
bekannt . 

25 

Es ist oftmals wiinschenswert , Busse dynamisch: aufzubauen, be- 
sonders dann, wenn ein Prozessor fiir Multitasking, 
Multithreading, Hyperthreading usw, verwendet werden soil, 

und/oder insbesondere wenn. sehr grolie Felder aus zum Beispiel 
30 65.536 PAEs Oder mehr aufgebaut werden sollen. 
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In eineiti solchen Fall ist es wunschenswert ^ fur eine automa- 
tische, selbsttatige, d.h. selbsterstellende dynamische 
Verbindung von Start- und Zielfeldern innerhalb eines solchen 
Feldes sorgen zu konnen. Als Start- und/oder Zielelemente 
5 konnen auch neben den aus der herkommlichen XPP-Technologie 
bekannten PAEs Elemente vorgesehen werden wie lO-Ports, fel- 
dinterne Speicher, Speicher-Ios, FPGAs, sequentielle CPUs, 
Sequencer, FSM (Finit-State-Machines) reine Lesespeicher, 
reine Schreibspeicher , NILdevices, etc. 

10 

Die vorliegende Erfindung schlagt somit . in einem weiteren. 
Grundgedanken ein Verfahren zum dynamischen Aufbau einer Ver- 
bindung zwischen einem Sender und einem Empfanger iiber einen 
einer Vielzahl moglicher Wege, der von Station zu Station 

15 f ortschreitet , vor, bei welchem vorgesehen ist, dass ausge- 

hend von einer den Busaufbau bewirkenden Einheit (Sender und/ 
Oder Empfanger) eine Anfrage an nachstliegende Stationen ge- 
sandt wird, welche fur den Busaufbau bereit stehen, diesen 
Stationen eine Kennziffer, hier gleichbedeutend, Kenngrolie, 

20 zugeordnet wird, ausgehend von wenigstens einer Vielzahl, be- 
vorzugt jeder freien Station, der eine Kennziffer zugeordnet 
wurde, eine Anfrage an nachstliegende Stationen nach der Ver- 
fugbarkeit der Stationen fiir einen Busaufbau gesandt wird, 
den verfiigbaren Stationen eine weitere Kennziffer zugeordnet 

25 wird, und dies fortgesetzt wird, bis das gewunschte Ende des 
Busses erreicht ist. 

Ein weiterer wesentlicher Aspekt der vorliegenden Erfindung 
nutzt somit die Erkenntnis aus, dass Busse problemfrei da- 
30 durch aufgebaut werden konnen, dass an nachstliegende 

Ubertraguhgs.stationen auf dem Weg eines moglichen Busses An- 
frag.eh gesandt werden, ob diese . Stationen fiir den Busaufbau 
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bereit stehen und dann^ ausgehend von bereitstehenden Statio- 
nen, in einem weiteren Schritt diese nachstliegenden 
Stationen angesprochen werden, wobei durch die Kennzif f erzu- 
ordnung eine Ansprechreihenf olge festgehalten wird^ urn anhand 
5 derselben eine Ruckverf olgung des Busaufbaus zu ermoglichen . 
Es ist dabei zwar moglich, dass nicht von jeder angesproche- 
nen und als frei erkannten Station beim Busaufbau 
weitergeschritten wird, weil etwa eine Auswertung in der Sta- 
tion eines gewunschten Zielpunktes zeigt, dass der Busaufbau 
10 sich weit in eine falsche Richtung bewegt hat, bevorzugt wird 
aber von jeder freien Station, der eine Kennzif fer zugeordnet 
wurde, versucht, den Bus weiter aufzubauen, indem die Nach- 
barstationen der zuerst angesprochenen Station gleichfalls 
angesprochen werden. 

15 

Hintergrund hierfiir ist, dass es Situationen geben kann, etwa 
bei einem bereits nahezu vollen Array, in welches weitere 
Konf igurationen hineingesetzt werden sollen, wo es erforder- 
lich ist, einen Busaufbau uber groJiere Uinwege zuzulassen, um, 
20 sollte ein Busaufbau uberhaupt moglich sein, diesen sicher zu 
ermoglichen. 

In einer bevorzugten Variante wird regelmaiiig jeder Station, 
die angesprochen wurde, eine Kennzif fer zugewiesen. Dies ist 

25 . vorteilhaf t , um f estzustellen, dass die Station bereits ange- 
sprochen wurde und somit nicht mehr bei Ansprechen aus einer 
anderen Richtung vermeintlich zur Verfiigung steht^ Dies ver- 
hindert, dass eine Signalausbreitung noch stattfindet, 
nachdem die Nachbarstationen bereits wieder als nicht beno- 

30 tigt freigegeben wurden. 
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In einer besonders bevorzugten Variante wird die KenngroBe 
von Station zu Station so verandert, dass der Weg, der beim 
Busaufbau gewahlt wird, nachvollziehbar ist, insbesondere im 
Wege eines Backtracing. Dieses Backtracing kann durch Inkre- 
5 mentierung oder Dekrementierung eines am Ziel erreichten 

Wertes erfolgen, insbesondere mit jeweils fester Schrittwei- 
te. Bei Vorsehen einer festen Schrittweite kann insbesondere 
. auch ein zyklisches Zahlen erfolgen, d. h. ein Zahlen in ei- 
nem zyklischen Zahlenraum, bei dem nach Oberschreiten des 

10 hochst moglichen Wertes immer wieder mit einem kleineren Wert 
begonnen wird (z. B. 1, 2, 3, 4; 1, 2, 3, 4; 1, 2, 3, 4; 

Oder 1, 2, 3, 4, 5; 1, 2, 3, 4, 5; 1, 2, 3, 4, 5; 

) . Dabei ist dann zur Charakterisierung der Station, um 

ein einwandf reies Riickverf olgen des Weges zu gewahrleisten, 

15 ein zyklisches Durchzahlen von mindestens drei verschiedenen 
Zahlwerten bevorzugt. 

Das beschriebene Verf ahren wird, sofern uberhaupt ein Busauf- 
bau zwischen Sender und Empf anger moglich ist, diesen 

20 auf zubauenden Bus identif izieren . Beim Busaufbau werden aber 
womoglich eine Vielzahl nicht benotigter Stationen angespro- 
chen und es ist daher bevorzugt, diese wieder freizugeben, 
und zwar nach Aufbau des Busses bzw. mit der Signalisierung 
zwischen Sender und Empfanger, dass ein Busweg aufgebaut wur- 

25 de. Dazu kann ausgehend von der letzten, den Aufbau 

vollendenden Station, typisch als dem S.ignalempf anger, wenn 
der Busaufbau ausgehend vom Sender hin zum Empfanger erfolgt, 
riickwarts unter Abschreitung der Kennwerte die. davorliegende 
Station angesprochen werden und sichergestellt werden, dass 

30 die von dieser Station angespr.ochenen, anderen und somit 
nicht auf dem Bus(ruck)weg liegenden Stationen fiir eine 
Fremdnutzung freigegeben werden. Dabei wird von jeder ange- 
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sprochenen und fur die weitere Benutzung in anderen Buswegen 
f reigegebenen Stationen wiederum f ortgeschritten zu alien an- 
deren, nicht benotigten Stationen, die zuvor angesprochen 
wurden. Auf diese Weise ist sichergestellt , dass alle Statio- 
5 . nen, die zuvor fur den Busaufbau angesprochen wurden, nunmehr 
wieder zur Verfiigung stehen. 

Es sei erwahnt, dass neben diesem Verfahren zur riickschrei- 
tenden Freigabe eines aufgebauten Busweges andere 

10 Moglichkeiten existieren, nach Aufbau eines Busweges zwischen 
Sender und Empf anger nicht benotigte Stationen freizugeben; 
So kann etwa langs aller Stationen, die fur den Busweg beno- 
tigt werden, ein Signal gesandt werden, welches den 
Busstationen mitteilt, dass sie am Busweg beteiligt sind. Ei- 

15 ne solche Information kann wiederum riickwarts gesandt werden 
im Wege des Back-tracing, etwa indem die Kennziffern ausge- 
wertet werden, die den Stationen wahrend der Aufbauphase 
zugeordnet wurden. Danach kann eine globale Freigabe erfol- 
gen, etwa indem ausgehend von der Anf angsstation oder einer 

20 zentralen Kontrollinstanz samtliche, momentan nicht an beste- 
henden Bussen verwendeten Stationen zuruckgesetzt bzw. fiir 
den Aufbau eines Busweges freigegeben werden. 

Es sei darauf hingewiesen, dass etwa auch unter bestimmten 
25 Bedingungen, wie nach einem festen Zeitablauf, eine Busfrei- 
gabe erfolgen kann. Diese Art der Freigabe. kann allerdings 
. verhindern, dass Busse, die per se aufbaubar waren, aufgebaut 
werden konnen; so ist bei sehr grolien Prozessorf eldern denk- 
bar, dass die Wege extrem lang werden, well um verschiedene, 
30 im Laufe des Betriebes dynamisch in das Feld hineinkonf igu- 
rierte Zellgruppenanordnungen maanderf ormig ein Weg herum 
bzw. durch solche Konf igurationeh gelegt werden muss, was bei 
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grolien Feldern sehr lange dauern kann. Sorge ist daher bevor- 
zugt dafur zu tragen^ dass eine hinreichende Zeit fur den 
Aufbau eines Busses verbleibt. 

5 Es sei erwahnt^ dass es prinzipiell moglich ist, insbesondere 
in sehr grofien Feldern, simultan mehrere Buswege bzw. Busver- 
bindungen zwischen unterschiedlichen Stationen und 
unterschiedlichen Empfangern aufzubauen. Dies kann jedoch da- 
zu fiihren, dass sich zwei aufzubauende Busverbindungen 
*- 10 wechselseitig im Fortschreiten blockieren, so dass keiner von 
den beiden Bussen erfolgreich eine Verbindung aufbaut. Es 
kann itiit anderen Worten zu einem Deadlock kommen. Dass derar- 
tige Deadlock-Situationen auch bei simultanem Aufbau mehrerer 
Busse verhindert werden konnen, sei erwahnt. So ist vorstell- 

15 bar, Bussen eine Prioritat zuzuordnen und damit zu 

gewahrleisten, dass dann, wenn ein auf zubauender Bus hoher 
Prioritat auf einen gleichfalls noch nicht aufgebauten Bus 
geringerer Prioritat trifft, die Stationen des Busses mit ge- 
ringerer Prioritat besetzt werden, d. h. dass die vorherige 

20 Reservierung fur einen auf zubauenden Bus geringerer Prioritat 
ignoriert wird. Dabei wird die tatsachliche Implement ierung 
derartiger Verbindungsaufbauten abharigig. davon zu gestalten 
sein, wie die fiir die Busauf bauprotokollumsetzung erforderli- 
che Logik in eine Halbleiterarchitektur umzusetzen ist, d. h.* 

25 welcher Aufbau im Einzelfall erforderlich ist; wie der Bu- 

saufbau und erf orderlichenf alls der Versuch eines Neuaufbaus 
nach Scheitern eines erste.n Versuchs auszusehen hat> ob eine 
Priorisierung erfolgen soil urid kann, wobei vorstellbar ist, 
eine Priorisierung eines auf zubauenden Busses etwa nach Be- 

30 deutung des Makros, das in das Feld konfiguriert wird, der 

Wartezeit seit dem Versuch eines ersten Aufbaus usw., zu be- 
stimmen. 
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Prinzipiell ware es moglich, nach dem Erreichen des Ziels 
ausgehend voiti Start, also typisch nach Erreichen des Empf an- 
gers ausgehend vom den Busaufbau typisch bewirkenden Sender, 
5 lediglich ein Signal auszusenden, das dem Sender anzeigt, 
dass uberhaupt ein Bus aufbaubar ist, damit dieser mit dem 
Senden beginnen mag. In einem solchen Fall konnte ein abzu- 
sendendes Datenpaket einfach wie eine Stationsaufbauanf rage 
an alle Nachbarstationen gesandt werden. Es miisste dann aber 

10 mit jedem Datenpaket sichergestellt werden, dass am Empf anger 
erkannt werden kann, von wo, das heifit von welcher Station 
ein abgesandtes Datenpaket zuerst empfangen wird, es muss si- 
chergestellt werden, dass ein bestimmtes Datenpaket nur 
einmal empfangen wird, auch wenn es iiber andere, verschlunge- 

15 ne Pfade spater noch einmal zum Empf anger gelangt. Bevorzugt 
wird aber in jedem Fall sein, dass die anderen Stationen 
freigegeben werden, etwa durch Back-tracing nach Erreichen 
der Zielstation, Dieses Busbeteiligungssignal, das ruckwarts 
gesandt wird,. kann ausgehend von den Zahlenwerten, die den 

20 Nachbarstationen zugeordnet werden, erfolgen. Im ubrigen sei 
darauf hingewiesen, dass es gleichfalls moglich. ist, dass 
sich die Station. lediglich merkt, aus welcher Richtung aus 
sie angesprochen wurde. In einem solchen Fall kann ohne Ver- 
gleich an den Nachbarstationen, welche Kennzif f erwerte diese 

25 besitzen, eine Riickverf olgung sehr schnell geschehen und es 
kann uberdies dann, wenn in der Station festgehalten wird, 
welche Nachbarstationen beim Busaufbau noch angesprochen wur- 
den, gewahrleistet werden, dass auch beim Back-tracing die 
nicht am aufgebauten Bus beteiligten Stationen freigegeben 

30 werden. 
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Die einer Station beim Ansprechen zuzuordnende Kennziffer 
kann daher auch eine Kennziffer sein, die die Richtung an- 
gibt, von welcher aus die Station angesprochen wurde . Bei 
vier nachsten anzusprechenden Nachbarn reichen dafiir bei- 
5 spielsweise zwei Bit. Warden zusatzlich noch die Stationen 
gespeichert, die angesprochen worden sind, wahrend der Bus 
aufgebaut wurde, sind weitere vier Bit erforderlich bei einer 
Vier-nachste-Nachbarn-Architektur . Es kann ein weiteres Bit 
hinzugefiigt werden, urn zu kennzeichnen, ob die Station uber- 

10 haupt schon angesprochen wurde oder vom Busaufbau des aktuell 
auf zubauenden Busses bislang unberiihrt geblieben war. Koiratien 
Priorisierungen und dergleichen dazu, sind weitere Zustande 
f estzuhalten. Es sei darauf hingewiesen, dass dies feingranu- 
lar erfolgen kann, und zwar insbesondere auch dann, wenn das 

15 Prozessorfeld fiir sich grobgranular aufgebaut ist. 

Es sei waiter darauf hingawiesen, dass verschiedene Moglich- 
keiten existieren, nach dam erf olgreichen Aufbau eines ersten 
Busses zwischen einem ersten Sender und einem ersten Empfan- 

20 ger den Aufbau eines zweiten Busses zwischen z. B. einem 
, zweiten Sender und einem zweiten Empf anger zu ermoglichen; 
dabei kann auch einer der. Sender und/oder einer der Empf anger 
identisch sein. Das Ansprechen von zwei Empfangern aus ein 
und demselben Sender kann sinnvoll sein, wenn etwa ein Be- 

25 rechnungsergebnis als Eingang fiir zwei verschiedene Zweige 

eines Programmes, die in unterschiedliche Bereiche hineinkon- 
figuriert sind, benotigt wird. Ein Ansprechen eines einzelnen 
Empfangers aus mehreren Sendern kann erwunscht sein, wenn 
dort etwa zwei Operanden, die aus unterschiedlichen Konfigu- 

30 rationsbereichen erhalten werdan sollen, zu verkniipfen sind, 
und ein Ansprechen von einem Empfanger uber ein und denselben 
Sender kann geboten sein, wenn Operanden, die zu unterschied- 
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lichen Zeiten erhalten bzw. bestimmt wurden^ an ein und dem- 
selben Empfanger miteinander verkniipft werden sollen, etwa in 
der Form an x an-i. Es kann dann uber Register im Bus sicherge- 
stellt werden, dass eine solche Verkniipfung nach Aufbau von 
5 zwei Bussystemen moglich ware, auch wenn dies typisch schon 
aus Griinden des Energieverbrauches im Bussystem weniger be- 
vorzugt ware als eine lokale Zwischenspeicherung von 
Operanden und dergleichen. Der Aufbau des weiteren oder 
nachst auf zubauenden Busses kann etwa dadurch erfolgen, dass 

10 mit dem Stationsf reigabesignal nach vorlaufiger Reservierung 
einer Station ein Signal mitgesandt wird, welches angibt, 
welchem aufgebauten Bus die Station gehorte, wobei dieser Bus 
etwa wiederum durch ein Priorisierungssignal gekennzeichnet 
werden kann. Wenn eine freigebende Station dann einer Station 

15 benachbart liegt, die gerne selbst einen Bus aufbauen wurde, 
der eine geringfugig niederere Priorisierung hat, kann dies 
dort festgestellt werden und es kann dann von dieser Station 
ausgehend der nachste Busaufbau bewirkt werden. Alternativ 
kann, bei einer globalen Freigabe aller momentan nicht an ei- 

20 nem Busaufbau benotigten Stationen und/oder danach ein 

globales Signal abgesandt werden, etwa von einer zentralen 
Kontrollinstanz, welches dem Feld mitteilt, welche Busverbin- 
dung als nachste aufzubauen ist bzw. welche Prioritat die 
nSchste aufzubauende Busverbindung haben soil. Statt eines 

25 globalen Broadcast einer derartigen Busaufbauverwalturigsin- 

formation kann auch insbesondere zentral und/oder an mehreren 
Stellen dezentral, etwa bei hierarchisch angeordneten Prozes- 
sorfeldern, bei denen innerhalb eines bestimmten Bereiches 
ein Bus- aufbau gewunscht wird, lokal und/oder regional eine 

30 Signalisierung an eine einen Busaufbau anfordernde Station 

wie einen Sender, der seinen Empfanger erreichen muss, erfol- 
gen . 
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Welche Art der Stationsf reigabe und/oder der Mitteilung, dass 
ein weiterer Bus aufgebaut warden kann, tatsachlich implemen- 
tiert wird, wird insbesondere davon abhangig sein, wie 
5 schnell die diesbeziigliche Information iiber das Array propa- 
giert werden kann und/oder welche Busauf bauhauf igkeit uber 
der Zeit erwartet wird. So kann dann, wenn eine Analyse 
zeigt, dass die auf einem Feld typisch benotigten und simul- 
tan abzuarbeitenden Konf igurationen selten einen Busaufbau 

10 erfordern, der zudem langsam erfolgen kann, eine prozessorar- 
chitektonisch einfache Implementierung gewaHlt werden, die 
mit wenigen Logikelementen auskommt, urn die entsprechende 
Steiierung zu gewahrleisten, wahrend bei sehr haufigein und 
auch schnell benotigtem Busaufbau eine komplexere Implemen- 

15 tierung sinnvoll sein kann. 

In einer besonders bevorzugten Variante ist es moglich, unter 
. mehreren per se bezuglich der Buslange und/oder des Umf angs 
der Stationen entlang des Busses gleichwertiger Bussysteme 

20 einen Bus auszuwahlen anhand verschiedener objektiver Beur- 
teilungskriterieh. Wahrend es prinzipiell moglich ist, in 
. einem solchen Fall eine zufallige Wahl zu treffen, konnen, je 
nach Anforderung und tatsachlicher Auslegung, unterschiedli- 
che Kriterien herangezogen werden. Es kann etwa bei 

25 Architekturen, die unterschiedliche Busverbindungen in Hori- 
zontal- und Vertikalrichtung aufweisen, etwa wenn die 
Busverbindungen . in Vertikalrichtung zusatzlich Register um- 
fassen, dutch welche die Daten zu schleusen sind, wahrend 
langs der Vertikalrichtung registerfrei und somit Daten mit 

30 geringeren Energieverlusten weiterleitende Busverbindungen 

existieren (ein Beispiel fiir eine solche Architektur ist die 
XPP 128 des Anmelders) , vorgesehen sein, dass beim Busaufbau 
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vermerkt wird, wie viele Schritte horizontal und vertikal ge- 
gangen wurden. Diese Information kann in einer Station 
abgelegt werden oder an einem Header, der mit dem Busauf- 
bauanf orderungssignal mitubertragen wird; es erfolgt dann zur 
5 Busauswahl eine Auswertung derartiger Inf ormationen . Alterna- 
tiv kann etwa an jeder Station abgefragt warden^ wie viele 
Busse in der Nahe der Station bereits existieren^ urn etwa zu 
ermoglichen, dass eine naherungsweise gleichmaBige Busverbin- 
dungsdichte uber das Array hinweg erhalten wird. Dieses 

10 Vorgehen ist einerseits vorteilhaft, well der Datentransport 
langs der Busse auf Grund der erf orderlichen Umladung. der 
Busleitungskapazitaten, den in Bussen zu integrierenden Trei- 
bern usw. einen erhohten Energieverbrauch ergibt^ weshalb 
eine Vergleichmaliigung der Busverteilungsdichte uber das Pro- 

15 zessorfeld zu einer Vergleichmaliigung der thermischen 

Belastung fuhrt. Insofern kann durch die Vergleichmaliigung 
insgesamt womoglich die Taktrate bei gleicher Kiihlung erhoht 
werden, was im Bereich mobiler Prozessoren fur Laptops, Han- 
dys und dergleichen vorteilhaft ist. Andererseits ist eine 

20 BusverbindungsdichtevergleichmaBigung auch vorteilhaft fur 
die Auslastungserhohung und Ressourcenschonung. 

Schutz wird auch beansprucht fur ein multidimensionales Feld 
rekonf igurierbarer Elemente, in welchem Bussysteme fur den 

25 dynamischen Selbstaufbau in einer der vorbeschriebenen Weisen 
und/oder in einer Weise^ wie sie aus dem nachf olgenden er- 
sichtlich ist, vorgesehen sind. Es sei darauf hingewiesen, 
dass die Bezeichnung ^multidimensionales Feld rekonf igurier- 
barer Elemente^^ sich auf grobgranulare rekonf igurierbare 

30 Elemente mit Elementen wie ALUs, erweiterten ALUs, RAMPAEs 
usw. beziehen kann, wie sie vorerwahnt wurden, und dass im 
Sinne der Erfindiing eine Multidimensionalitat nicht nur durch 
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die raiimliche Ubereinanderanordnung und Nebeneinanderanord- 
nung von rekonf igurierbaren Elementen erhalten werden kann, 
sondern auch durch eine bestimmte Art und Weise der Verbin- 
dung. So sind in linear angeordneten Feldern den Elementen in 
5 der Mitte zwei nachste Nachbarn zugeordnet, in zweidimensio- 
nalen Feldern wie bei einer Kachelung typisch vier nachste 
Nachbarn, und in einer dreidimensionalen Anordnung typisch 
sechs nachste Nachbarn, wie dies aus der Stapelung von Wiir- 
feln und dergleichen erkannt werden kann. Die Verwendbarkeit 

10 etwa drei- oder sechseckiger Zellen sei beispielhaft erwahnt. 
Es ist aber auch moglich, zusatzlich Busverbindungen vorzuse- 
hen, die diagonal verlaufen, iibernachste Nachbarn verbinden, 
groBere Strecken vorsehen usw. Wird eine solche Busstruktur 
implement iert, ergibt sich eine Multidimensionalitat mit ei- 

15 nem Dimensionsmafi grofier 1, wobei dieses DimensionsmaB auch 
von einer ganzen Zahl verschieden sein kann. Eine solche An- 
ordnung wird in jedem Fall als multidimensionales Feld der 
vorliegenden Erfindung betrachtet. 

20 Die vorliegende Erfindung wird im Folgenden nur beispielswei- 
se an Hand der Zeichnuhg beschrieben. In dieser zeigt: 

Fig. El ein multidimensionales Feld miteinander kommuni- 
zierender rekonf igurierbarer Elemente, die fur 
25 den Busaufbau ausgebildet sind, vor dem Beginn 

des Busaufbaus; 
Fig. E2 das Feld von Fig. 1 nach dem ersten Busaufbau- 
schritt; 

Fig. E3 das Feld von Fig. 1 nach dem zweiten Busaufbau- 
30 schritt; 
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Fig. E4 das Feld von Fig. 1, nachdem das Empf angerf eld 

erreicht wurde, mit unterschiedlichen, moglichen 
Busverbindungen; 

Fig. E5 die Anordnung mit dem ausgewahlten Bus . 

Nach Fig. 1 umfasst ein allgmein mit 1 bezeichnetes Feld 1 
eine Vielzahl rekonf igurierbarer Zellen, die miteinander uber 
selbstaufbauende Busse kommunizieren konnen. 



- 10 Jede Zelle la, lb, Ic usw., die am Busaufbau zu beteiligen 

ist, weist interne Logikelemente auf, die es ermoglichen, In- 
formationen daruber zu speichern, ob die Zelle derzeit von 
einem Bus bereits verwendet wird (mit X gekennzeichnete Zel- 
len in Feld 1), ob die Zelle bereits als mogliche Buszelle 

15 bei einem aktuellen Busaufbau angesprochen wurde, und, wenn 
ja, in wie vielen vertikalen und horizontalen Schritten der 
Busaufbau bis zur Zelle erfolgte, wie viele Schritte insge- 
samt beim Busaufbau zuriickgelegt wurden oder ob die Zelle 
noch vollstandig frei ist und noch nicht angesprochen wurde. 

20 Um die Anzahl der horizontal bzw. vertikal von einem Bus be- 
reits abgeschrittenen Zellen auf dem Weg zwischen einer 
moglichen Sender zelle S und einer moglichen Empf anger zelle e 
abzulegen, sind in jeder Zelle zwei Speicherbereiche vorgese- 
hen, die in den Figuren mit H und V bezeichnet sind. Welter 

25 ist ein Speicherbereich fiir die Gesamtzahl der durchlauf enen 
Schritte ablegbar, wie durch die grossen Zahlen 1 - 12 in den 
Figuren 1-5 dargestellt. Dabei ist die gewahlte Maximalzahl 
12 nur beispielhaf t , da dies im gewahlten Beispiel geringer 
Komplexitat die erf orderliche Schrittzahl zum Erreichen des 

30 Empf angers, ausgehend vom gewahlten Sender, ist. Die Zellen 

sind welter dazu ausgebildet, dann, wenn sie ein Busaufbauan- 
f orderungssignal erhalten und f rei . sind, an einem 



- 102 - 



Akte: PACT33/PCT 




auf zubauenden Bus teilzunehmen, und zugleich an Nachbarsta- 
tionen in einem nachf olgenden Schritt eine Anfrage zu senden, 
ob diese Nachbarstationen gleichfalls fiir den Busaufbau frei 
sind. Dazu weisen sie Signal-Sende- und -Empf angsverbindungs- 
5 beschaltungen fur die jeweils nachsten Nachbarn auf. Die 

einzelne Zelle ist waiter so ausgebildet, dass zusammen mit 
dem Busauf bauanf orderungssignal Information bezuglich der 
insgesamt schon zuruckgelegten Schrittweite und der Anzahl 
der horizontalen und vertikalen Teilschritte (H und V) an die 
10 angesprochenen Stationen ubermittelt werden kann. 

Der Busaufbau geschieht im vorliegenden Fall wie folgt: 
Zunachst wird das dynamisch konf igurierbare Array derart be- 
trieben, dass alle Busse aufgebaut seien. Es mogen dann 

15. bestiininte Konf igurationen enden und es sei erf orderlich, eine 
neue Konf iguration f ragmentiert in freie Bereiche des Arrays 
hineinzukonf igurieren, well eine hinreichende Anzahl funktio- 
nell geeigneter Zellen derzeit nicht zur Verfiigung steht. Es 
sei dabei welter ein Fall gegeben, bei welchem alle Felder 

20 bis auf die mit X bezeichneten fiir den Busaufbau zur Verfii- 
gung stehen. 

Nun wird von jenen Zellen, die miteinander zu kommunizieren 
haben, um ein in das Array hineinzukonf igurierendes Makro 

25 ausfiihren zu konnen, eine Sende- und eine Empfangs zelle fest- 
gelegt. Dies kann durch die Konf iguration bzw. den Scheduleir 
Oder ahnliches geschehen. Diese sind in Fig. 1 mit S bezeich- 
net. Nun sendet die den Busaufbau bewirkende Senderzelle S 
ein erstes Busauf bauanf orderungssignal an ihre unmittelbaren 

30 Nachbarn^ das heisst jene Zellen, die an deren Zellenkanten 
angrenzen, im dargestellten Beispiel also an vier Zellen. 
Diese Zellen stellen fest, dass sie frei sind, dass sie die 
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ersten Stationen sind, die Busaufbauanf orderungssignale er- 
halten, und dass sie jeweils einen Schritt horizontal oder 
vertikal respektive von der Sendezelle entfernt sind. Es wird 
nun in den Nachbarzellen entsprechend in den H- und V- 
5 Speicherbereich eine 0 bzw. 1 eingespeichert, und es wird ei- 
ne 1 in den Schrittweitenspeicher der angefragten Zelle 
gespeichert. 

Im zweiten Schritt spricht jede zuvor angesprochene freie 
10 Zelle wiederuiti ihre eigenen Nachbarzellen an und f ragt bei 
diesen an, ob sie fur den Busaufbau zur Verfiigung stehen. 
Dies fiihrt dazu, dass eine Reihe weiterer Zellen danach er- 
kannt haben, dass sie fiir den Busaufbau benotigt werden und 
die zweiten Zellen im Verlauf eines moglicherweise aufgebau- 
15 ten Busses darstellen. Weiter werden entsprechende Vermerke 
liber die horizontale bzw. vertikale Schrittweite in entspre- 
chenden Speicherbereichen abgelegt. Die bereits mit X 
gekennzeichneten Zellen ignorieren hingegen das Busaufbauan- 
f orderungssignal, wie das in der 4. Zelle von links, 2. Zeile 
20 von unten der Fall ist. 



Nachdem die ersten Zellen ihre Nachbarzellen. angesprochen ha- 
ben, ist klar, dass sie in weiteren Busaufbauschritten 
schweigen konnen; ein Busanf orderungssignal wird so nur un- 

25 mittelbar im Schritt nach jenem ausgesandt, welcher die das 

Busaufbauanf orderungssignal aussendende Zelle reserviert hat. 
Dies verhindert zwar, dass Zellen, die erst wahrend des Bus- 
aufbaus freigegeben werden, spater noch reservierbar sind, 
spart aber, da nicht immer wieder von alien bereits reser- 

30 vierten Zellen Busaufbauanf orderungssignale ausgesandt werden 
miissen, was Treiberleistung erfordert, Energie und ist somit 
etwa ftir mobile Anwendungen bevorzugt, wo der erhaltene Vor- 
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teil uberwiegt gegeniiber Losungen^ bei denen spater freiwer- 
dende Zellen auch noch in einen entstehenden Bus 
miteinbezogen werden konnen; hier ware allerdings besonders 
etwa Sorge dafur zu tragen^ dass stets in jenen Nachbarzellen 
5 der Bus-aufbau als relevant eingestuft wird, die die gering- 
sten Schrittweiten langs des Busses erfordern. Im nachsten 
Busaufbauschritt sprechen nun die zweiten Zellen ihre jewei- 
ligen Nachbarzellen wiederum an, wobei, da die Zellen 1 fiir 
den Busaufbaii schon reserviert sind, die Zellen 2 nicht mehr 
10 zurucklauf en konnen, sondern nur nach vorne, weg vom Sender. 
Dies setzt sich fort, bis der Empf anger schliefilich erreicht 
ist, vergleiche Fig. 4. 

Es sind nun im Beispiel am Empf anger zwei Zellen gleichzeitig 
15 angekommen, die beide die gleiche Schrittweite 12 tragen und 
es ist, wie durch die verschieden gestrichelten Linien er- 
sichtlich, moglich, liber diese Zellen ruckwartsschreitend 
unterschiedliche Buswege aufzubauen. Es ware hier zwar prin- 
zipiell eine zufallige Auswahl moglich, es wird aber, wie 
20 bevorzugt, zunachst bei jedem Abschreiten in Ruckwartsrich- 
tung versucht, die V-Werte maximal zu halten. Dies fiihrt zu 
dem durchgehend gezeichneten Bus in Fig. 5. Sobald der Bu- 
saufbau durch Ruckwartsschreiten bestatigt wurde, konnen alle 
Zellen, die nicht daran beteiligt sind, abgewiesen -und wieder 
25 freigegeben werden. Dazu. wird ein globales Busf reigabesignal 
ausgestrahlt, das anzeigt, dass alle derzeit nicht an einem 
aufgebauten Bus beteiligten Zellen sich zuriicksetzen konnen. 



Es sei erwahnt, dass die Art und Weise des Busaufbaus durch 
30 dynamische Selbstorganisation unter Verwendung geeigneter, 
dem Durchschnittsf achmann aus der Of fenbarung ersichtlichen 
Hardwareschaltungen in der Zelle festlegbar ist. 
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Paten 'tansproiche 

1. Verfahren zur Auswahl eines aus einer Vielzahl von Wegen 
zur Erzielung eines Datenverarbeitungsergebnisses bei der 
Datenverarbeitung unter zumindest moglicher Verwendung 
multidimensionaler Felder konf igurierbarer Datenhandha- 
bungselemente, dadurch gekennzeichnet, daB den 
Datenhandhabungselementen konf igurationsabhangig lei- 
stungsauf nahmebezogene kennzeichnende Grolien zugeordnet 
warden und eine Wegauswahl unter Zuordnungsbewertung er- 
folgt. 

2. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet , daB einer aus einer Vielzahl 

unter schiedlicher Algorithmen ausgewahlt wird. 

3. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
daB eine aus einer Vielzahl unterschiedlicher Konfigura- 
tionen ausgewahlt wird. 

4. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
daB viber die Zuordnung. einer gegebenen Datenverarbeitungs- 
aufgabe und/oder -teilaufgabe an ein multidimensionales 
Feld konf igurierbarer ■ Datenhandhabungselemente und/oder 
einer anderen Datenverarbeitungsarchitektur,. insbesondere 
an ein ASIC, und/oder an eirie rein sequenziell arbeitende 
CPU bei der Wegauswahl entschieden wird. 




Akte: PACT33/PCTE 



5. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
daJi ein zweidimensionales Feld konf igurierbarer Datenhand- 
habungselemente betrachtet wird. 



6. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet ^ 
dali eine Auswahl aus einem zur Laufzeit konf igurierbaren^ 
insbesondere storungsfrei partiell rekonf igurierbaren Pro- 
zessorfeld vorgenommen wird- 

7 . Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
dali als konf igurierbare Datenhandhabungselemente zumindest 
einige, bevorzugt alle der Elemente Busse, Register, ALUs, 
RAMs und/oder andere grobgranulare Datenhandhabungselemen- 
te betrachtet werden. 

8- Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
dali der kennzeichnende Wert unabhangig von der tatsachli- 
chen aktuell zugeordneten Aufgabe nur davon abhangig 
gewahlt wird, ob das jeweilige Datenhandhabungselement 
iiberhaupt verwendet wird oder nicht. 

9- Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dafi jeder Konf iguration eine eigene Kennzahl 
bei der Verwendung zugeordnet wird. 

10. Verfahren nach dem vorhergehenden unabhangigen An- 

spruch Oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dali. eine strom-, arbeits- und/oder lei- 
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stungsbezogene GroBe als verbrauchskennzeichnende GroJie 
zugeordnet wird. 

11. Verfahren nach dem vorhergehenden Anspruch, dadurch 
5 gekennzeichnet , daii eine Auswahl unter Berucksichtigung 

eines Summenwertes verbrauchskennzeichnender Grofien er- 
folgt. 

12 . Verfahren nach dem vorhergehenden unabhanglgen An- 
10 spruch Oder einem Unteranspruch hierzu , dadurch 

gekennzeichnet, dafi eine Auswahl unter Berucksichtigung 
weiterer GroBen erfolgt, insbesondere einer erf orderlichen 
Ausf iihrungszeit und/oder erf orderlicher Ressourcen, einer 
aktuellen Prozessorauslastung und/oder einer aktuell ge— 
15 wunschten und/oder moglichen Leistungsauf nahme . 

13. Verfahren nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet , dafi eine Auswahl vor der eigent lichen Da- 
tenverarbeitung erfolgt. 

20 

14. Verfahren nach dem vorhergehenden unabhanglgen An- 
spruch Oder einem Unteranspruch hierzu > dadurch 
gekennzeichnet, daB die KennzeichnungsgroBen bei der Simu- 
lation einer Datenverarbeitung bereitgestellt und/oder 

25 ausgewahlt werden. 

15. Verfahren nach dem vorhergehenden unabhanglgen An- 
spruch Oder einem Unteranspruch hierzu dadurch 
gekennzeichnet , daB eine Auswahl zur Laufzeit erfolgt - 



16. Verfahren zum Betrieb eines multidimensionalen Feldes 
rekonf igurierbarer Elemente> . 



-4 - 
Alt 



Akte: PACT33/PCTE 



worin Anordnungen von 

Gruppen zusammen datenhandhabender Elemente in vorbestimm- 

ter Weise wahrend der Laufzeit zur Abarbeitung 
vorgegebener Aufgaben in das Feld hinein konfiguriert wer- 
5 den, 

dadurch gekennzeichnet daJi 

fur zumindest eine abzuarbeitende Aufgabe eine Mehrzahl 
von solchen Elementgruppenanordnungen im multidimensiona- 
len Feld bestimmt wird, die zur Abarbeitung der 
10 vorgegebenen Aufgabe geeignet sind, 

fur die Abarbeitung der vorgegebenen Aufgabe eine dann be- 
sonders geeignete Eleitientgruppenanordnung aus der Mehrzahl 
ausgewahlt wird und 

die ausgewahlte in das Feld hinein konfiguriert wird. 

15 

17 . Verf ahren nach dem vorhergehenden Anspruch dadurch ge- 
kennzeichnet , dali die Elementgruppenanordnung anhand ihrer 
Geometrie im Vergleich mit der Geometrie im Feld bereits 
fur die Umkonf iguration verfugbarer und/oder vermutlich 
20 bald verfugbar werdender Elemente ausgewahlt wird. 

.18. Verf ahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , worin Elementgruppenan- 
ordnungen betreffende Konf igurationsdaten aus einem 

25 Speicher mit nicht vernachlassigbaren Zugrif f szeiten ein- 

gelesen werden und/oder mit nicht vernachlassigbaren 
Generierungszeiten generiert werden^ dadurch gekennzeich- 
net, dafi zumindest fiir einige Konf igurationen fur die 
Auswahl zunachst nur ein gegenuber dem Konf igurationsda- 

30 tensatz aller Konf igurationsdaten in der Grolie reduzierter 

Kenndatensatz, insbesondere ein Satz von. die Geometrie be- 
treffenden Kenndaten, in eine 
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Elementgruppenanordnungsauswahlstuf e eingelesen warden, 
eine Auswahl aufgrund des Kenndatensatzes getroffen wird 
und dann im Ansprechen auf die Auswahl die Konf igurations- 
daten aus dem Speicher gelesen oder generiert werden. 

5 

19. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , worin bei der Umkonfigu- 
rierung des Feldes zur Durchfuhrung einer Mehrzahl 
zumindest teilweise simultan auszuf uhrender Aufgaben,. von 
10 denen fiir wenigstens zwei Gruppen zusammen Dateh handha- 

bender Elemente in vorbestimmter Weise wahrend der 
Laufzeit zur Abarbeitung vorgegebener Aufgaben in das Feld 
hinein konfiguriert werden, 

eine Mehrzahl von solchen Eleitientgruppenanordnungen, die 
15 zur Abarbeitung der vorgegebenen Aufgabe geeignet sind, 

vorbestimmt werden, 

die zu einer gegebenen Zeit und/oder einem gegebenen Er- 
eignis fur die zumindest teilweise simultane 
Hineinkonf iguration verfiigbarer Ressourcen bestimmt werden 
20 und jene El.ementgruppenanordnungen aus der vorbestimmten 

Anzahl ausgewahlt werden, mit denen eine simultane Abar- 
beitung besonders effizient. moglich ist, 

20.. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
25 Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 

daB eine erste Elementgruppenanordnung in das Feld hinein- 
konfiguriert wird, mit dieser Elementgruppenanordnung 
begonnen wird, die Aufgabe abzuarbeiten, bis ein vorgege- 
benes Ereignis auftritt und danach uriter zumindest 
30 partieller Rekonf iguration mit der Auf gabenabarbeitung in 

einer weiteren. Elementgruppenanordnung fortgefahren wird. 
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21. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , worin die Elementgrup- 
penanordnungen sich hinsichtlich der 

Abarbeitungsgeschwindigkeit unterscheiden und die Auswahl 
.5 • im Ansprechen auf die gegebenenf alls unter Beriicksichti- 
gung weiterer Aspekte maximal erzielbare 
Abarbeitungsgeschwindigkeit erf olgt . 

22. Multidimensionales Prozessorf eld aufweisend 

10 eine Vielzahl benachbart angeordneter Datenverarbeitungs- 

zellen rtiit 

Eingangen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-Verkniipfungseinheit , die diese entspre- 
chend der jeweiligen Funktion ihrer Operanden- 
15 Verkniipf ungseinheit verkniipfen und 

Ausgangen, um die Daten verknupft auf Vernetzungswege 
auf zugeben, 

dadurch gekennzeichnet , dal5 
die Datenverarbeitungszellen ein Aspektverhaltnis aufwei- 
20 . sen^ das wenigstens 2:1^ bevorzugt 2:1 betragt- 

23. Multidimensionales Prozessorf eld nach dem • vorhergehenden 
Anspruch^ dadurch gekennzeichnet , dafi die Datenverarbei- 
tungszellen als grobgranular konf igurierbare Zellen 

25 ausgebildet sind. 

2.4. Multidimensionales Prozessorf eld nach dem vorhergehenden 
unabhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet , dali Datenverarbeitungszellen in 
30 Reihen und Spalten angeordnet sind. 
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25. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet , dal5 zuitiindest bei einem Teil der Datenver- 

arbeitungszellen Dateneingange vorgesehen sind, urn von 
einer oberen Reihe Daten zu erhalten und Datenausgange, urn 
an eine untere Reihe Daten auszugeben, 

26. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dali die Datenverarbeitungseinheiten EALUs, 
ALU und/oder registerf lankierte Zellen sind. 



27. Verfahren zur Konf igurierung eines Prozessorf eldes nach 
dem vorhergehenden unabhangigen Anspruch oder einem Un- 
teranspruch hierzu , worin Zellen fur die Konf iguration 
ausgewahlt und in Funktion und Vernetzung bestimmt werden, 
15 wobei eine Vernetzung derart bestimmt wird, dalJ Daten von 

Zelle zu Zelle zumindest weitgehend ver zogerungsf rei iiber- 
tragbar sind, dadurch gekennzeichnet, dafi als benachbarte 
Zellen, zwischen denen Daten binnen eines Taktes oder ei- 
ner geringen Taktzahl iibertragbar sind, auch solche 
20 berucksichtigt werden, die nicht unmittelbar nebeneinander 

liegen, sondern in der Breite durch eine Strecke getrennt 
sind, die geringer ist als die Lange der Zelle. 



25 28. Multidimeiisionales Prozessorf eld aufweisend 

eine Vielzahl benachbart angeordneter Datenverarbeitungs- 
zellen mit 

Eingangen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-Verknupf ungseinheit , die diese entspre- 
30 chend der jeweiligen Funktion ihrer Operanden- 

Verknupf ungseinheit verknupfen und 

Ausgangen, um die Daten verkniipft auf Verne tzungswege 
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auf zugeben, 

dadurch gekennzeichnet, dali 
die Datenverarbeitungszellen ein Aspektverhaltnis aufwei- 
sen, das wenigstens 2:1, bevorzugt 2:1 betragt. 

29. Multidimensionales Prozessorf eld nach dem vorhergehenden 
. Anspriich, dadurch gekennzeichnet , daiJ die Datenverarbei- 
tungszellen als grobgranular konf igurierbare Zellen 
ausgebildet sind. 

30. Multidimensionales Prozessorf eld nach dem vorhergehenden 
unabhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, daB Datenverarbeitungszellen in 
Reihen und Spalten angeordnet sind. 



31. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dali zumindest bei einem Teil der Datenver- 
arbeitungszellen Dateneingange vorgesehen sind, um von 
einer oberen Reihe Daten zu erhalten und Datenausgange, um 

20 an eine untere Reihe Daten auszugeben. 

32. Prozessorf eld nach dem vorhergehenden . Anspruch, dadurch 
gekennzeichnet, dali die Datenverarbeitungseinheiten EALUs, 
ALU und/oder registerf lankierte Zellen sind. 

25 

33. Verfahren zur Konf igurierung eines Prozessorf eldes nach 
dem vorhergehenden unabhangigen Anspruch oder einem Un- 
teranspruch hierzu. , worin Zellen fur die Konf iguration 
ausgewahlt und in Funktion und Vernetzung bestimmt werden, 

30 wobei eine Vernetzung derart bestimmt wird, dali Daten von 

Zelle zu Zelle zumindest weitgehend verzogerungsf rei uber- 
tragbar sind, dadurch gekennzeichnet, daB als benachbarte 
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Zellen, zwischen denen Daten binnen eines Taktes oder ei- 
ner geringen Taktzahl ubertragbar sind, auch solche 
beriicksichtigt warden, die nicht unmittelbar nebeneinander 
liegen, sondern in der Breite durch eine Strecke getrennt 
sirid, die geringer ist als die Lange der Zelle. 



© 
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34. Datenverarbeitungsanordnung mit einem multidimensionalen 
Feld 

10 in Funktion und/oder Vernetzung konf igurierbarer Zelle- 

lemente und 

dieseri zugeordneten Konf igurationsvorhalteitiitteln zum 
lokalen Konf igurations-Vorhalten, 
dadurch g e k e n n z e i c h n e t , d a li 
15 die Konf igurationsvorhaltemittel dazu ausgebildet sind, 

zumindest einen Teil der vorgehaltenen Konf igurationen 
nicht fliichtig vor zuhalten . 

35. Datenverarbeitungsanordnung mit einem multidimensionalen 
20 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zelle- 
.. lemente und 

diesen zugeordneten Konf igurationsvorhaltemitteln zum 
lokalen Konf igurations^Vorhalten, 
25 dadurch gekennzeichnet^ dafi 

. die Konf igurationsvorhaltemittel dazu ausgebildet sind, 
zumindest einen Teil der vorgehaltenen Konf igurationen 
nichtf liichtig vorzuhalten. 

30 36. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, daB die Funktion grobgranular kon- 
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figurierbar ist. 

37. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet., dafi die Vernetzung grobgranular 
konf igurierbar ist . 

38. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , . 
dadurch gekennzeichnet ^ dafi als Zellelemente zumindest ei- 
nes von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, Logiblocken 
vorgesehen sind. 

39. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet , dafi jedem Zellelement ein eigenes 
Konf igurationsvorhaltemittel zugeordnet ist. 

40. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet , dafi die Konf igurationsvorhaltemit- 
tel dazu ausgebildet. sind, eine Vielzahl yon 

Konf igurationen vorzuhalten. 

41. Datenverarbeitungsanorndung, dadurch gekennzeichnet, dafi 
mehrere fest vorgegebene riichtf luchtige Konf igurationen im 
Konf igurationsvorhaltemittel. vorgegeben sind. 

42. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet , dafi die Anordnung dazu ausgebildet 
ist, eine wechselnde einer Vielzahl von vorgehaltenen Kon- 




figurationen zu verwenden, insbesondere im Wege der Wave- 
Rekonf iguration oder des lokalen Sequencing. 

43. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
5 abhangigen Anspruch oder einem Unteranspruch hierzu , 

dadurch gekennzeichnet , daB bei eingien Zellen im Betrieb 
mit veranderlichen Konf igurationen versehbare Konfigurati- 
onsvorhaltemittel vorgesehen sind. 

10 44. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet , dali als Konf igurationsvorhaltemit- 
tel zunmindest eines aus ROM, EPROM, EEPROM, Flash- 
Speicher, Fuse-, Antif use-programmierbare Speichermittel 

15 und/oder in insbesondere in oberen Lagen einer Silizium- 

struktur fest vorgesehene Speichermittel gewahlt sind. 

45. Verfahren zur Herstellung einer dedizierten Datenverar- 
beitungsanordnung, dadurch gekennzeichnet , dafi ein 

20 multidimensionales Feld mit. in Funktion und/oder Vernet- 

zung konf igurierbaren Zellelemente und diesen zugeordneten 
Konf igurationsvorhaltemitteln zum lokalen Konf iguratipns - 
Vorhalten vorgegeben wird, bestimmt wird, welche Konfigu- 
rationen in diesen vorzuhalten sind, und dann 

25 nichtf liichtige Konf igurationsvorhaltemittel so vorgesehen 

werden, daB sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf liichtig- vorhalten. 

46. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
30 kennzeichnet, daB von einem zur laufzeitrekonf igurierbaren 

multidimensionalen Feld ausgegangen wird. 
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47. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet , daB zunachst von einem zur 

lauf zeitrekonf igurierbaren multidimensionalen Feld mit re- 
konf igurationsbeschaltung ausgegangen wird und dann fur 
5 rekonf iguration nichtbenotigte Felder weggelassen werden. 

48. Rekonf igurierbare Signalverarbeitungsvorrichtung mit ei- 
ner Vielzahl von miteinander , insbesondere konf igurierbar 
verknupfbaren Signalverarbeitungsschaltkreisen, die in 

10 ihrer Funktion veranderlich sind, wobei diese einen Aus- 

gang aufweisen^ liber welchen eine Uitikonf igu-rierung 
angefordert und/oder eine Akzeptierung einer Umkonf igura- 
tion vorgesehen werden kann, dadurch gekennzeichnet ^ dass 
zumindest ein Teil der verknupfbaren Signalverarbeitungs- 

15 schaltkreise analoge Signalverarbeitungsschalt kreise. 

sind, wobei weiter eine Rekonf igurationseinheit zur Vor- 
gabe von Konf igurationen fiir die das. Analogsignal 
verarbeitenden Schaltkreise vorgesehen ist. 

20 49. Rekonf igurierbare Signalverarbeitungsvorrichtung nach dem 
vorhergehenden Anspruch, dadurch gekennzeichnet , dass ein 
Teil der Signalverarbeitungsschaltkreise digitale Schalt- 
kreise sind. 



25 50. Datenverarbeitungsvorrichtung mit einem Datenverar- 

beitungslogikzellenf eld und zumindest einer Sequenziell- 
CPU, dadurch gekennzeichnet , dass eine Ankopplung der Se- 
quenziell-CPU und des Datenverarbeitungslogikzellenf eldes 
zum Datenaustausch in insbesondere blockweiser Form durch 

30 zu einem Cache-Speicher fuhrende Leitungen moglich ist. 
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50. Verfahren zuiti dynamischen Aufbau 

einer Verbindung zwischen einem Sender und einem Empfan- 
ger 

uber einen einer Vielzahl moglicher Wege, der von Station 
5 zu Station f ortschreitet , 

dadurch gekennzeichnet ^ dass 

ausgehend von einer den Busaufbau wirkenden Einheit (Sen- 
10 der und/oder Empf anger) eine Anfrage an nachstliegende 

Stationen gesandt wird, welche fiir den Busaufbau bereit 
stehen^ 

diesen Stationen eine Kennziffer zugeordnet wird, 
ausgehend von wenigstens einer Vielzahl, bevorzugt jeder 
15 freien Station, der eine Kennziffer zugeordnet wurde, ei- 

ne Anfrage an nachstliegende Stationen nach der 
Verf ugbarkeit der Stationen fur einen Busaufbau gesandt 
wird, 

den verfiigbaren Stationen eine weitere Kennziffer zuge- 
20 ordnet wird, und dies fortgesetzt wird, bis das 

gewunschte Ende des Busses erreicht ist. 

51. Verfahren nach dem vorhergehenden Anspruch, worin von 
Station zu Station, die jeweils fur ein Fortschreiten des 

25 Busaufbaus verf iigbar . ist , unabhangig davon, ob mit dieser 

Station das Ziel erreicht werden. wird oder nicht, eine 
veranderte Kennziffer zugewiesen wird. 

52. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
30 kennzeichnet , dass die Veranderung von Station zu Station 

nachvollziehbar gewahlt wird, wobei insbesondere eine In- 
crement ie rung Oder Decrementierung eines Zahlwertes urn 
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eine feste GroBe erfolgt, insbesondere mit Schrittweite 
gegebenenf alls durch zyklisches Zahlen, d.h. Zahlen in 
einem endlichen, zyklischen Zahlenraum. 

5 '53- Verfahren nach dem vorhergehenden Anspruch^ dadurch ge- 
kennzeichnet ^ dass zyklisch bis mindestens drei 
verschiedene Zahlwerte zur Charakterisierung der Station 
durchgezahlt warden. 

10 54. Verfahren nach dem vorhergehenden unabhangigen Anspruch 

Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
dalJ nach Aufbau eines Bus-Weges zwischen Sender und Emp- 
fanger nicht benotigte Stationen wieder freigegeben 
werden. 



55. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet ^ 
dass ein Bus als aufgebaut betrachtet wird, sobald von 
einer Station aus das Ziel erreicht worden ist. 

56. Verfahren nach. dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnetf dass. nach dem Aufbau eines . ersten Busses 
der Aufbau weiterer Busverbindungen unterbunden wird. 



25 57. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass den an einem aufgebauten Bus 
beteiligten Stationen das Erreichen des Busaufbaues mit- 
geteilt wird. 

30 58. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet , dass den an einem aufgebauten Bus 
beteiligten Stationen das Erreichen des Busaufbaues mit- 
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geteilt wird, 

indem ausgehend vom Ziel in Ruckwartsrichtung den am Bus 
beteiligten Stationen ein Busbeteiligungssignal zugesandt 
wird, insbesondere durch Ubertragen von Signalen entlang 
des Busses. 

59. Verfahren nach dem vorhergehenden Anspruch^ dadurch ge- 
kennzeichnet, dass die Identif ikation der am aufgebauten 
Bus beteiligten Stationen erfolgt, indem ausgehend vom 
Ziel die den erreichbaren Stationen gegebenenf alls zuge- 
ordneten Zahlenwerte verglichen werden und jene Stationen 
ausgewahlt werden^ die einen buszugehorigkeitsindikativen 
Zahlenwert besitzen. 

60. Verfahren nach dem vorhergehenden Anspruch, worin ausge- 
hend von einer Startposition die Zahlenwerte 
incrementiert werden, wahrend beim Busaufbau von Station 
zu Station f ortgeschritten wird und worin nach Erreichen 
des Ziels jene Stationen als zum Bus zugehorig identifi- 
ziert werden, die jeweils die kleinsten Zahlenwerte 
erreichbarer Stationen besitzen. 

61. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass eine Freigabe nicht fvir eine 
Busverbindung benotigter Stationen durch Markierung jener 
Stationen, die an einem aufgebauten, benotigten Bus teil- 
haben, und Freigeben aller nicht dergestalt markierten 
Stationen, insbesondere durch das Senden eines globalen 
Freigabesighals erfolgt. 

62. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 
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dass die Freigabe nicht benotigter Stationen wellenartig 
durch Zurucklaufen von einer Ziel- zu einem Starteinheit 
erfolgt und/oder durch Riickwartslauf en vom Ziel zum Start 
unter Freigabe nicht benotigter Stationen durch Senden 
eines Freigabesignals durch jeweils jene Station^ die bei 
der f reizugebende Station zuvor angefragt hatte, ob sie 
fur den Busaufbau zur Verfiigung stehe. 

63- Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , worin simultan eine 
Vielzahl von Busverbindungen aufgebaut wird, dadurch ge- 
kennzeichnet , dass zu jeder fur den Aufbau einer 
Busverbindung angesprochenen Station ein Richtungswert 
zugeordnet wird, insbesondere in der Station abgespei- 
chert wird, der angibt, aus welcher Richtung oder von 
welcher ansprechenden Station ein Busauf bauanf orderungs- 
signal erhalten wurde, 

64. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet , dass die Busverif ikation durch Auswertung 
der Signale erfolgt, die anzeigen, von welcher anspre- 
chenden Station, aus ein Busaufbaiianf orderungssignal 
gesandt wurde und worin der Busaufbau zu dieser anfor- 
dernden Station hin erfolgt. 

65. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dass bei Vorliegen mehrerer, eine gleiche Anzahl von Sta- 
tionen benotigender Busse, die potenziell aufbaubar sind, 
ein Bus anhand eines dem Bus zuweisbaren und/oder zuge- 
wiesenen Beurteilungskriterium ausgewahlt wird. 
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66. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet , dass als Busbeurteilungskriterium die 
Anzahl horizontal und/oder vertikal durchlauf ender Sta- 
tionen und/oder die Anzahl registerbehaf teter Stationen 
5 und/oder die Verbindungsdichte existierender Busverbin- 

dungen langs der Stationen und/oder die Grofie 
verbleibender freier Felder, die nicht durch den Bus ver- 
teilt werden, herangezogen wird. 

10 67. Multidimensionales Feld rekonf igurierbarer Elemente, wo- 
bei zumindest zwischen einigen der konf igurierbaren 
Elemenmte dynamisch aufbaubare Busse vorgesehen sind, da- 
durch gekennzeichnet , dass im Bussystem Einheiten 
vorgesehen sind, die dazu ausgebildet sind, direkt oder 

15 uber Fernbusse indirekt benachbarte Gruppen in Bussegmen- 

ten anzusprechen und/oder eine Busstationsnummer zu 
speichern und/oder eine Bef orderungssignalrichtung zu 
speichern und/oder einen Abbau von temporar gehaltenen 
Verbindungen zu womoglich fiir einen Busaufbau benotigten 

20 Stationen nach Feststellung des Nichtbenotigens durch 

Freigabe zu ermoglichen. 

68 . Datenverarbeitungsvorrichtung mit einem Datenverarbei- 
tungslogikzellenf eld und zumindest einer Sequenziell-CPU, 
25 dadurch gekennzeichnet , dass eine Ankopplung der Sequenzi- 

ell-CPU und des Datenverarbeitungslogikzellenf eldes zum 
Datenaustausch in insbesondere blockweiser Form durch zu 
einem Cache-Speicher fiihrende Leitungen moglich ist. 
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